OpenAI lanserade på måndagen en ny AI-modell och skrivbordsversion av ChatGPT, tillsammans
med ett uppdaterat användargränssnitt, företagets senaste försök att utöka användningen av sin populära chatbot.
Uppdateringen ger GPT-4 till alla, inklusive OpenAI: s gratisanvändare, sa teknikchef Mira Murati i ett livestreamat evenemang. Hon tillade att den nya modellen, GPT-4o, är ”mycket snabbare” med förbättrade funktioner i text, video och ljud. OpenAI sa att de så småningom planerar att låta användare videochatta med ChatGPT.
”Det här är första gången som vi verkligen tar ett stort steg framåt när det gäller användarvänligheten”, säger Murati.
OpenAI, som backas upp av Microsoft har värderats till mer än 80 miljarder dollar av investerare. Företaget, som grundades 2015, är under press för att hålla sig på toppen av den generativa AI-marknaden samtidigt som man hittar sätt att tjäna pengar eftersom det spenderar enorma summor på processorer och infrastruktur för att bygga och träna sina modeller.
O:et i GPT-4o står för omni. Den nya modellen gör att ChatGPT kan hantera 50 olika språk med förbättrad hastighet och kvalitet, och den kommer också att vara tillgänglig via OpenAI:s API vilket gör det möjligt för utvecklare att börja bygga applikationer med den nya modellen redan idag, säger Murati.
Hon tillade att GPT-4o är dubbelt så snabb som, och kostar hälften av, GPT-4 Turbo.
Nu börjar AI hantera känslor
OpenAI:s teammedlemmar demonstrerade den nya modellens ljudfunktioner, till exempel genom att be den hjälpa till att lugna ner någon inför ett offentligt tal. OpenAI-forskaren Mark Chen sa att modellen kan ”uppfatta dina känslor” och tillade att modellen också kan hantera användare som avbryter den. Teamet bad det också att analysera en användares ansiktsuttryck för att kommentera de känslor som personen kan uppleva.
”Hallå där, hur är läget? Hur kan jag göra din dag ljusare idag?” sa ChatGPT:s ljudläge när en användare hälsade på det.
Voice mode
Företaget planerar att testa Voice Mode under de kommande veckorna, med tidig åtkomst för betalda abonnenter på ChatGPT Plus, enligt ett blogginlägg. OpenAI sa också att den nya modellen kan svara på användarnas ljudmeddelanden ”på så lite som 232 millisekunder, med ett genomsnitt på 320 millisekunder, vilket liknar mänsklig svarstid i en konversation.”
Chen demonstrerade modellens förmåga att berätta en godnattsaga och bad den att ändra tonen i rösten för att bli mer dramatisk eller robotaktig. Han bad den till och med att sjunga sagan.
Översättare
Dessutom kan OpenAI: s nya modell fungera som en översättare, även i ljudläge, sa företaget. Chen demonstrerade verktygets förmåga att lyssna på Murati som talade italienska medan han talade engelska och att översätta till deras respektive språk när de samtalade.
Matematiska ekvationer
Teammedlemmar demonstrerade också modellens förmåga att lösa matematiska ekvationer och hjälpa till att skriva kod, vilket positionerade den som en starkare konkurrent till Microsofts egen GitHub Copilot.
För OpenAI var lanseringen ett av företagets största tillkännagivanden sedan augusti kickoff av ChatGPT Enterprise, AI-chatbotens affärsnivå. Det verktyget var under utveckling i ”under ett år” och hade hjälp av mer än 20 företag i varierande storlek och branscher, berättade OpenAI Chief Operating Officer Brad Lightcap CNBC vid den tiden.
Guldrush
OpenAI, Microsoft och Google som står vid rodret för en generativ AI-guldrush när företag i till synes alla branscher tävlar om att lägga till AI-drivna chatbots och agenter till viktiga tjänster för att undvika att bli kvar av konkurrenterna. Tidigare denna månad tillkännagav OpenAI-konkurrenten Anthropic sitt första företagserbjudande någonsin och en gratis iPhone-app.
Rekordhöga 29,1 miljarder dollar investerades i nästan 700 generativa AI-affärer 2023, en ökning med mer än 260% från föregående år, enligt PitchBook. Marknaden förutspås toppa 1 biljon dollar i intäkter inom ett decennium.
Vissa i branschen har uttryckt oro över den hastighet med vilken otestade nya tjänster kommer ut på marknaden, och akademiker och etiker är bekymrade över teknikens tendens att sprida fördomar.
Efter ChatGPT:s lansering i november 2022 slog den rekord som den snabbast växande konsumentappen i historien och har nu cirka 100 miljoner aktiva användare varje vecka. OpenAI säger att mer än 92% av Fortune 500-företag använder plattformen.
Murati sa under måndagsevenemanget att OpenAI vill ”ta bort en del av mystiken från tekniken.”
”Under de närmaste veckorna kommer vi att rulla ut dessa funktioner till alla”, sa hon.
Den nya modellen kommer först att rullas ut på tisdag till kunder av ChatGPT Plus och Team, och sedan till Enterprise senare, sa ett blogginlägg på måndag. Den kommer också att vara tillgänglig för gratisanvändare av ChatGPT från och med måndag, med användningsgränser. Användare av ChatGPT Plus kommer att ha fem gånger mer meddelandekapacitet än gratisanvändare, och kunder av ChatGPT Team och Enterprise kommer att ha ännu större användningsgränser.
Murati avslutade det livestreamade evenemanget med att tacka Nvidias VD Jensen Huang och hans företag för att de tillhandahåller de nödvändiga grafikprocessorenheterna (GPU) för att driva OpenAI:s teknik.
”Jag vill bara tacka det otroliga OpenAI-teamet, och även tacka Jensen och Nvidia-teamet för att ha gett oss de mest avancerade GPU: erna för att göra den här demonstrationen möjlig idag”, sa hon.
Lämna kommentar