Els pirates informàtics estan decidits a millorar la IA

Taula de continguts:

Els pirates informàtics estan decidits a millorar la IA
Els pirates informàtics estan decidits a millorar la IA
Anonim

Clau per emportar

  • Un nou col·lectiu de desenvolupadors està construint models d'IA de codi obert.
  • El grup utilitza models massius de formació lingüística que llançarà sota llicències obertes.
  • La IA de codi obert podria ajudar a fer que el poder potencialment canviant de joc de la nova tecnologia sigui menys propens a biaixos i errors.
Image
Image

Hi ha molta investigació sobre la intel·ligència artificial per part de grans empreses (IA), però un grup en línia vol democratitzar el procés.

EleutherAI és un col·lectiu recentment format d'investigadors, enginyers i desenvolupadors voluntaris centrats en la investigació d'IA de codi obert. L'organització utilitza les bases de codi GPT-Neo i GPT-NeoX per entrenar models d'idiomes massius que té previst llançar amb llicències obertes.

"Les dades de codi obert beneficien els investigadors perquè els científics tenen més recursos gratuïts per utilitzar per entrenar models i completar la investigació", va dir Edward Cui, director general de l'empresa d'IA Graviti, a Lifewire en una entrevista per correu electrònic. La seva empresa no participa en EueutherAI. "Sabem que nombrosos projectes d'IA es van frenar per la manca general de dades d' alta qualitat de casos d'ús reals, per la qual cosa és vital establir una guia que garanteixi la qualitat de les dades, amb l'ajuda de la comunitat participant.".

Aquest és el camí

Els inicis de l'EleutherAI van ser humils. L'any passat, un investigador d'IA independent anomenat Connor Leahy va publicar el missatge següent en un servidor de Discord: "Hola nois, deixem que [SIC] doni a l'OpenAI una carrera pels seus diners com els bons dies."

I així es va formar el grup. Ara té centenars de col·laboradors que publiquen el seu codi al dipòsit de programari en línia GitHub.

Els esforços d'IA de codi obert no són nous. De fet, la plataforma de gestió de flux de treball Airflow d'Airbnb i el motor de descoberta de dades de Lyft són els resultats de l'ús d'eines de codi obert per permetre als equips de dades fer un millor treball amb les dades, va assenyalar Ali Rehman, director de projecte de l'empresa de programari CloudiTwins en una entrevista per correu electrònic amb Lifewire..

"De la mateixa manera que la revolució del codi obert ha portat a una transformació del desenvolupament de programari, també ha estat impulsant el desenvolupament i la democratització de la ciència de dades i la intel·ligència artificial", va dir Rehman. "El codi obert s'ha convertit en un facilitador crític de les solucions empresarials de ciència de dades, amb la majoria dels científics de dades que utilitzen eines de codi obert."

Obrint la porta

El desenvolupament d'IA de codi obert podria ajudar a fer que el poder potencialment canviant de joc de la nova tecnologia sigui menys propens a biaixos i errors, segons alguns observadors.

La investigació d'IA es fa principalment a l'aire lliure, amb gairebé totes les empreses, laboratoris de recerca i universitats que presenten els seus resultats immediatament en publicacions acadèmiques, va dir Kush Varshney, investigador d'IA a IBM, a Lifewire en una entrevista per correu electrònic.

"Aquesta comunitat oberta és essencial, ja que ofereix nivells millorats de controls i equilibris per garantir que la IA s'investiga, es crea, es desplega i s'aplica de manera responsable", va afegir Varshney. "Això és especialment crític en situacions en què aquests sistemes poden influir en la vida dels nostres membres més vulnerables de la societat. Aquesta obertura s'aplica no només a l'aprenentatge automàtic general i als algorismes d'aprenentatge profund, sinó també a elements d'IA fiable."

Rehman va dir que una de les diferències crítiques entre el programari propietari i de codi obert és la flexibilitat i la personalització. La investigació d'IA patentada tindrà problemes amb la seguretat, les actualitzacions i les optimitzacions.

Image
Image

"Això es deu al fet que l'enfocament de codi obert basat en la comunitat obté aportacions valuoses de milers d'experts del sector que identifiquen possibles vulnerabilitats de seguretat que després es solucionen més ràpidament", va afegir Rehman."El consens de la comunitat fa que la qualitat estigui garantida i les noves oportunitats s'identifiquin més fàcilment."

Un altre problema és que la investigació d'IA patentada no serà interoperable, el que significa que no pot funcionar amb diversos formats de dades i probablement tindrà un bloqueig de proveïdors, la qual cosa impedeix que les empreses provin i provi el programari abans de comprometre's amb una solució. va dir Rehman.

Però no tots els aspectes de la investigació en IA han de ser de codi obert, va dir Chris Kent, director general de l'empresa mèdica d'IA Reveal Surgical, a Lifewire en una entrevista per correu electrònic. "És important protegir els incentius econòmics que impulsen el desenvolupament comercial d'aplicacions clau de la IA", va dir.

No obstant això, la investigació sobre IA necessita un component de codi obert robust, va dir Kent. Va afegir que el codi obert treballa per generar confiança i utilitzar conjunts de dades que no estan o no haurien de ser controlats per institucions o empreses individuals.

"Un enfocament de codi obert és la millor manera d'identificar i compensar el biaix subjacent que pot existir en els conjunts d'entrenament i donarà lloc a aplicacions d'IA més holístiques, creatives i fiables", va dir Kent..

Recomanat: