Sunteți interesat de ele OFERTE? Economisiți cu cupoanele noastre WhatsApp o telegramă!

Există o problemă uriașă care împiedică antrenamentul rețelelor neuronale

În lumea dinamică ainteligență artificiale, companiile de top tehnologice se confruntă cu o provocare neașteptată care ar putea încetini ritmul inovației: creșterea dificultate în găsirea datelor de calitate pentru antrenarea modelelor lor. Acest deficit de date afectează dezvoltarea tehnologiilor avansate, cum ar fi GPT-5, în timp ce companii de calibrul Microsoft și OpenAI caută soluții inovatoare pentru a depăși acest obstacol.

Provocări de formare AI: există o foame de date și acest lucru încetinește progresul

Într-o eră marcată de o creștere fără precedent a puterii de calcul și de progresul tehnicilor de învățare automată, OpenAI și oamenii săi se confruntă cu o paradox: Abundența de date online nu se traduce automat într-o resursă utilizabilă pentru instruirea AI. The au nevoie de date exacte, relevantă și actualizată este mai critică decât oricând, mai ales când vine vorba de antrenarea modelelor din ce în ce mai complexe, cum ar fi GPT-5 planificat.

Tranziția de la GPT-4 la GPT-5 ilustrează această creștere exponențială a cererii de date: în timp ce primul a necesitat „doar” 12 trilioane de jetoane, estimările pentru succesor sunt în jur de 60-100 de trilioane. Discrepanța dintre disponibilitatea și nevoia de date de înaltă calitate apare ca un obstacol semnificativ, estimând a deficit care ar putea varia între 10 și 20 de trilioane de jetoane.

logo openai pe smartphone pe fundal alb

Acest deficit de date de calitate se traduce într-un adevărat blocaj pentru progresul AI. Datele adesea învechite sau de calitate scăzută care populează web-ul reprezintă o problemă serioasă limită pentru eficacitatea învățării automate. În plus, restricțiile impuse de accesul la date de către platformele mari nu fac decât să agraveze problema, limitând și mai mult resursele disponibile pentru instruire. modele lingvistice.

Ca răspuns la această provocare, strategiile adoptate variază de la inovații tehnice la parteneriate strategice. OpenAI, de exemplu, își propune să îmbunătățeascăfolosind date audio și video prin instrumentul său de recunoaștere a vorbirii Whisper, pentru a extinde grupul de date disponibile. În paralel, compania explorează posibilitatea de generează date sintetice de calitate care poate servi la umplerea golului existent.

Gianluca Cobucci
Gianluca Cobucci

Pasionat de cod, limbi și limbi, interfețe om-mașină. Tot ceea ce este evoluția tehnologică mă interesează. Încerc să-mi divulg pasiunea cu cea mai mare claritate, bazându-mă pe surse de încredere și nu „pe prima trecere”.

subscrie
notifica
oaspete

0 comentarii
Feedback-uri în linie
Vezi toate comentariile
XiaomiToday.it
logo