Els pirates informàtics estan decidits a millorar la IA

👤 Autora Abigail Brown 📧 brown@technologyhumans.com.
⏱ Public 2023-12-17 06:42.
🖍 Última modificació 2025-01-24 12:04.

Clau per emportar

Un nou col·lectiu de desenvolupadors està construint models d'IA de codi obert.
El grup utilitza models massius de formació lingüística que llançarà sota llicències obertes.
La IA de codi obert podria ajudar a fer que el poder potencialment canviant de joc de la nova tecnologia sigui menys propens a biaixos i errors.

Hi ha molta investigació sobre la intel·ligència artificial per part de grans empreses (IA), però un grup en línia vol democratitzar el procés.

EleutherAI és un col·lectiu recentment format d'investigadors, enginyers i desenvolupadors voluntaris centrats en la investigació d'IA de codi obert. L'organització utilitza les bases de codi GPT-Neo i GPT-NeoX per entrenar models d'idiomes massius que té previst llançar amb llicències obertes.

"Les dades de codi obert beneficien els investigadors perquè els científics tenen més recursos gratuïts per utilitzar per entrenar models i completar la investigació", va dir Edward Cui, director general de l'empresa d'IA Graviti, a Lifewire en una entrevista per correu electrònic. La seva empresa no participa en EueutherAI. "Sabem que nombrosos projectes d'IA es van frenar per la manca general de dades d' alta qualitat de casos d'ús reals, per la qual cosa és vital establir una guia que garanteixi la qualitat de les dades, amb l'ajuda de la comunitat participant.".

Aquest és el camí

Els inicis de l'EleutherAI van ser humils. L'any passat, un investigador d'IA independent anomenat Connor Leahy va publicar el missatge següent en un servidor de Discord: "Hola nois, deixem que [SIC] doni a l'OpenAI una carrera pels seus diners com els bons dies."

I així es va formar el grup. Ara té centenars de col·laboradors que publiquen el seu codi al dipòsit de programari en línia GitHub.

Els esforços d'IA de codi obert no són nous. De fet, la plataforma de gestió de flux de treball Airflow d'Airbnb i el motor de descoberta de dades de Lyft són els resultats de l'ús d'eines de codi obert per permetre als equips de dades fer un millor treball amb les dades, va assenyalar Ali Rehman, director de projecte de l'empresa de programari CloudiTwins en una entrevista per correu electrònic amb Lifewire..

"De la mateixa manera que la revolució del codi obert ha portat a una transformació del desenvolupament de programari, també ha estat impulsant el desenvolupament i la democratització de la ciència de dades i la intel·ligència artificial", va dir Rehman. "El codi obert s'ha convertit en un facilitador crític de les solucions empresarials de ciència de dades, amb la majoria dels científics de dades que utilitzen eines de codi obert."

Obrint la porta

El desenvolupament d'IA de codi obert podria ajudar a fer que el poder potencialment canviant de joc de la nova tecnologia sigui menys propens a biaixos i errors, segons alguns observadors.

La investigació d'IA es fa principalment a l'aire lliure, amb gairebé totes les empreses, laboratoris de recerca i universitats que presenten els seus resultats immediatament en publicacions acadèmiques, va dir Kush Varshney, investigador d'IA a IBM, a Lifewire en una entrevista per correu electrònic.

"Aquesta comunitat oberta és essencial, ja que ofereix nivells millorats de controls i equilibris per garantir que la IA s'investiga, es crea, es desplega i s'aplica de manera responsable", va afegir Varshney. "Això és especialment crític en situacions en què aquests sistemes poden influir en la vida dels nostres membres més vulnerables de la societat. Aquesta obertura s'aplica no només a l'aprenentatge automàtic general i als algorismes d'aprenentatge profund, sinó també a elements d'IA fiable."

Rehman va dir que una de les diferències crítiques entre el programari propietari i de codi obert és la flexibilitat i la personalització. La investigació d'IA patentada tindrà problemes amb la seguretat, les actualitzacions i les optimitzacions.

"Això es deu al fet que l'enfocament de codi obert basat en la comunitat obté aportacions valuoses de milers d'experts del sector que identifiquen possibles vulnerabilitats de seguretat que després es solucionen més ràpidament", va afegir Rehman."El consens de la comunitat fa que la qualitat estigui garantida i les noves oportunitats s'identifiquin més fàcilment."

Un altre problema és que la investigació d'IA patentada no serà interoperable, el que significa que no pot funcionar amb diversos formats de dades i probablement tindrà un bloqueig de proveïdors, la qual cosa impedeix que les empreses provin i provi el programari abans de comprometre's amb una solució. va dir Rehman.

Però no tots els aspectes de la investigació en IA han de ser de codi obert, va dir Chris Kent, director general de l'empresa mèdica d'IA Reveal Surgical, a Lifewire en una entrevista per correu electrònic. "És important protegir els incentius econòmics que impulsen el desenvolupament comercial d'aplicacions clau de la IA", va dir.

No obstant això, la investigació sobre IA necessita un component de codi obert robust, va dir Kent. Va afegir que el codi obert treballa per generar confiança i utilitzar conjunts de dades que no estan o no haurien de ser controlats per institucions o empreses individuals.

"Un enfocament de codi obert és la millor manera d'identificar i compensar el biaix subjacent que pot existir en els conjunts d'entrenament i donarà lloc a aplicacions d'IA més holístiques, creatives i fiables", va dir Kent..

Recomanat:

Els pirates informàtics estan decidits a millorar la IA

Taula de continguts:

Clau per emportar

Aquest és el camí

Obrint la porta

Recomanat:

Els investigadors demostren que el popular rastrejador GPS és vulnerable als pirates informàtics

Els pirates informàtics podrien fer un seguiment del vostre iPhone fins i tot quan estigui apagat

Els pirates informàtics han trobat una manera de falsificar qualsevol adreça de Gmail

Ara és més fàcil que els pirates informàtics utilitzin la informació pública contra vostè

Els pirates informàtics introdueixen programari maliciós als ordinadors dels jugadors

Animeu el text una paraula a la vegada a PowerPoint

Com sincronitzar el vostre controlador Xbox amb una Xbox One o un PC

Diagnòstic d'un fusible d'amplificador d'àudio de cotxe cremat

Afegir una segona bateria de cotxe per a un àudio de gamma alta

7 maneres de guanyar diners reproduint videojocs a Twitch

Com crear una fórmula de cerca d'Excel amb diversos criteris

Com reproduir música a l'Apple Watch

Com copiar i enganxar estils de text en un Mac

Com fer una cerca booleana a Google

Com restablir tots els models d'iPod nano

Boot Camp afegeix suport per a Windows Precision Touchpad

El Logitech Mx Master 3 és el ratolí que Apple hauria d'haver fet

Les noves notes ràpides d'Apple podrien canviar la manera d'organitzar la informació

M'agradaria que hi hagués més a FaceTime a Android

El text en directe d'iOS 15 us permet mirar el món que us envolta