Hacker sind versessen darauf, KI zu verbessern

Inhaltsverzeichnis:

Hacker sind versessen darauf, KI zu verbessern
Hacker sind versessen darauf, KI zu verbessern
Anonim

Key Takeaways

  • Ein neues Entwicklerkollektiv erstellt Open-Source-KI-Modelle.
  • Die Gruppe verwendet massive Sprachtrainingsmodelle, die sie unter offenen Lizenzen veröffentlichen wird.
  • Open-Source-KI könnte dazu beitragen, die potenziell bahnbrechende Kraft der neuen Technologie weniger anfällig für Verzerrungen und Fehler zu machen.
Image
Image

Große Unternehmen (KI) forschen viel über künstliche Intelligenz, aber eine Online-Gruppe möchte den Prozess demokratisieren.

EleutherAI ist ein kürzlich gegründetes Kollektiv aus freiwilligen Forschern, Ingenieuren und Entwicklern, die sich auf Open-Source-KI-Forschung konzentrieren. Die Organisation verwendet die GPT-Neo- und GPT-NeoX-Codebasen, um massive Sprachmodelle zu trainieren, die sie unter offenen Lizenzen veröffentlichen möchte.

"Open-Source-Daten kommen Forschern zugute, da Wissenschaftlern mehr freie Ressourcen zur Verfügung stehen, um Modelle zu trainieren und Forschungsarbeiten abzuschließen", sagte Edward Cui, CEO des KI-Unternehmens Graviti, Lifewire in einem E-Mail-Interview. Sein Unternehmen ist nicht an EueutherAI beteiligt. „Wir wissen, dass zahlreiche KI-Projekte durch einen allgemeinen Mangel an qualitativ hochwertigen Daten aus realen Anwendungsfällen aufgeh alten wurden, daher ist es wichtig, mit Hilfe der teilnehmenden Gemeinschaft Leitlinien zu erstellen, die die Datenqualität gewährleisten.“

Das ist der Weg

Die Anfänge der EleutherAI waren bescheiden. Letztes Jahr hat ein unabhängiger KI-Forscher namens Connor Leahy die folgende Nachricht auf einem Discord-Server gepostet: „Hey Leute, lasst [SIC] OpenAI einen Kampf um ihr Geld geben wie in den guten alten Tagen.“

Und so wurde die Gruppe gegründet. Es hat jetzt Hunderte von Mitwirkenden, die ihren Code auf dem Online-Software-Repository GitHub veröffentlichen.

Open-Sourcing-KI-Bemühungen sind nicht neu. Tatsächlich sind die Workflow-Management-Plattform Airflow von Airbnb und die Data Discovery Engine von Lyft das Ergebnis der Verwendung von Open-Source-Tools, mit denen Datenteams besser mit Daten arbeiten können, betonte Ali Rehman, Projektmanager des Softwareunternehmens CloudiTwins, in einem E-Mail-Interview mit Lifewire.

"So wie die Open-Source-Revolution zu einer Transformation der Softwareentwicklung geführt hat, hat sie auch die Entwicklung und Demokratisierung von Data Science und künstlicher Intelligenz vorangetrieben", sagte Rehman. "Open Source ist zu einem entscheidenden Faktor für Data-Science-Lösungen für Unternehmen geworden, wobei die Mehrheit der Data Scientists Open-Source-Tools verwendet."

Tür öffnen

Die Entwicklung einer Open-Source-KI könnte dazu beitragen, die potenziell bahnbrechende Kraft der neuen Technologie weniger anfällig für Vorurteile und Fehler zu machen, argumentieren einige Beobachter.

KI-Forschung findet heute hauptsächlich offen statt, wobei fast alle Unternehmen, Forschungslabors und Universitäten ihre Ergebnisse sofort in wissenschaftlichen Veröffentlichungen präsentieren, sagte Kush Varshney, ein KI-Forscher bei IBM, Lifewire in einem E-Mail-Interview.

"Diese offene Gemeinschaft ist unerlässlich, da sie ein verbessertes Maß an Kontrollen und Ausgleichen bietet, um sicherzustellen, dass KI verantwortungsbewusst erforscht, entwickelt, eingesetzt und angewendet wird", fügte Varshney hinzu. „Dies ist besonders kritisch in Situationen, in denen diese Systeme das Leben unserer am stärksten gefährdeten Mitglieder der Gesellschaft beeinflussen können. Diese Offenheit gilt nicht nur für allgemeines maschinelles Lernen und Deep-Learning-Algorithmen, sondern auch für Elemente vertrauenswürdiger KI.“

Rehman sagte, dass einer der entscheidenden Unterschiede zwischen proprietärer und Open-Source-Software Flexibilität und Anpassung ist. Proprietäre KI-Forschung wird Probleme mit Sicherheit, Updates und Optimierungen haben.

Image
Image

"Das liegt daran, dass der Community-basierte Open-Source-Ansatz wertvolle Beiträge von Tausenden von Branchenexperten erhält, die potenzielle Sicherheitslücken identifizieren, die dann schneller behoben werden", fügte Rehman hinzu."Durch den Konsens der Community ist die Qualität garantiert und neue Möglichkeiten werden leichter erkannt."

Ein weiteres Problem ist, dass proprietäre KI-Forschung nicht interoperabel sein wird, was bedeutet, dass sie nicht mit verschiedenen Datenformaten arbeiten kann und wahrscheinlich eine Anbieterbindung haben wird, die Unternehmen daran hindert, die Software zu testen und auszuprobieren, bevor sie sich auf eine Lösung festlegen, sagte Rehman.

Aber nicht jeder Aspekt der KI-Forschung muss Open Source sein, sagte Chris Kent, der CEO des medizinischen KI-Unternehmens Reveal Surgical, in einem E-Mail-Interview mit Lifewire. „Es ist wichtig, die wirtschaftlichen Anreize zu schützen, die die kommerzielle Entwicklung von Schlüsselanwendungen der KI vorantreiben“, sagte er.

Die Erforschung von KI benötigt jedoch eine robuste Open-Source-Komponente, sagte Kent. Er fügte hinzu, dass Open Source dazu dient, Vertrauen aufzubauen und Datensätze zu verwenden, die nicht von einzelnen Institutionen oder Unternehmen kontrolliert werden oder nicht kontrolliert werden sollten.

"Ein Open-Source-Ansatz ist der beste Weg, um zugrunde liegende Verzerrungen zu identifizieren und zu kompensieren, die in Trainingssets vorhanden sein können, und wird zu ganzheitlicheren, kreativeren und zuverlässigeren Anwendungen der KI führen", sagte Kent.

Empfohlen: