Googlen uudet kielimallit ovat yllättävän hyviä

sekä Alphabet ja Meta sijoittavat miljoonia Hollywoodiin + muita uutisia, viikon chatbot-vinkki ja AI-työkalu.

Jun 02, 2024

Enää viikko odotusta Tekoäly Premiumin julkaisuun 9.6.! 🥳

Tekoälyn huipulla Premiumiin kuuluu: Joka toinen viikko podcast AI-huippuosaajan kanssa, viikoittainen AI-työkaluraportti ja vielä lisäksi ekslusiivinen AI-yhteisö, johon uutiset tulevat nopeammin, joka mahdollistaa niistä sekä muista AI-aiheista keskustelun samanhenkisten ihmisten kanssa.

Olen saanut bookattua jo monien huippunimien kanssa podcast-haastattelut. Viime viikolla mainitsin jo Suomen nopeimmin kasvavan IT-yrityksen Codenton toimitusjohtajan, Euroopan parhaan ammattivalokuvaajan 2021, joka on muuttunut AI-taiteilijaksi, Startup-konkarin Pasi Vuorion, joka on perustanut AI-Startupin LastBotin. Lisäksi uutena bookkauksena olen saanut somessa suurta suosiota saaneen Noora Kuisman, joka on perustanut AI-Startupin Aida Appin ilman kovaa teknistä taustaa käyttäen tekoälyä apurinaan sen pyörittämisessä!

Aivan mielettömiä vieraita tulossa, en voi olla enemmän innoissani! 🤩

ps. olen päättänyt vaihtaa uutiskirjeen lähetysalustan Substackista beehiiviin. Tämä tapahtuu automaattisesti, eikä sinun tarvitse tehdä mitään.

Mennään viikon AI-uutisiin:

Suosituimmat Uutiset

OpenAI:hin liittyvistä draamantäyteisistä aiheista on tullut useita päivityksiä, mukaan lukien vuodettuja asiakirjoja yhtiön kiistanalaisiin salassapitosopimuksiin liittyen, uutta tietoa "Sky"-äänimallista, toinen irtisanoutuminen ja muuta.

ChatGPT:n "Sky"-äänen takana oleva ääninäyttelijä on tullut esiin ja sanonut, että hänet palkattiin kuukausia ennen kuin Altman otti yhteyttä Scarlett Johanssoniin. Vuodetut asiakirjat Sam Altmanin allekirjoituksella ovat ristiriidassa väitteiden kanssa, että hän ei tiennyt salassapitosopimusten lausekkeista, jotka uhkasivat periä takaisin entisten työntekijöiden osakkeet.
OpenAI:n politiikan tutkija Gretchen Kreuger erosi viitaten yhtiön turvallisuushuoliin. VivaTech-konferenssissa pidetyistä esityksistä on tullut esiin vihjeitä siirtymisestä pois "GPT-5"-nimestä ja uudesta Sora-demosta.

Coheren voittoa tavoittelematon tutkimushaara C4AI julkaisi Aya 23:n - perheen huippuluokan monikielisiä kielimalleja, joissa on avoimet painot ja tuki 23 eri kielelle.

Aya 23:lla on 8 miljardin parametrin malli, joka on suunniteltu tehokkuutta ja saavutettavuutta varten, sekä edistyksellinen 35 miljardin parametrin malli, joka perustuu Command R -arkkitehtuuriin. Mallit perustuvat aiempaan Aya 101 -aloitteeseen, joka kattoi 101 kieltä, keskittyen nyt enemmän syvyyteen. Aya 23 ylittää merkittävästi Aya 101:n suorituskyvyn useissa vertailukohdissa ja ylittää myös muut avoimet kilpailijat, kuten Googlen Gemman ja Mistralin.

OpenAI ilmoitti uuden turvallisuus- ja turvakomitean perustamisesta valvomaan sen seuraavan sukupolven tekoälymallin kehitystä, jonka kouluttamisen yhtiö sanoi myös aloittaneensa hiljattain.

Uutta komiteaa johtaa toimitusjohtaja Sam Altman, ja siihen kuuluvat hallituksen jäsenet Bret Taylor, Adam D'Angelo ja Nicole Seligman. Ryhmä arvioi turvallisuus- ja suojausprosesseja seuraavien 90 päivän ajan, ja suunnitelmissa on jakaa hyväksytyt suositukset julkisesti. OpenAI sanoi, että uusi malli "vie meidät seuraavalle tasolle kyvyissämme matkalla kohti yleistä tekoälyä (AGI)".

Canva esitteli joukon uusia tekoälyominaisuuksia luovalle alustalleen, mukaan lukien tekstistä grafiikaksi -ominaisuudet, tekoälyllä toimiva kuvaeditori, videoiden muokkauksen päivitykset ja muuta.

Uusi "Magic Media" -tekstistä grafiikaksi -työkalu mahdollistaa kuvien, kuvakkeiden ja kuvitusten luomisen yksinkertaisista tekstikehoteista.
"Magic Switch" muuntaa ja luo vaihtoehtoisia mediamuotoja sekunneissa, kuten esityksen verkkosivustoksi. Uusi "Magic Write" -copywriting-avustaja luo käyttäjän ääneen sopivaa tekstiä lyhyestä kirjoitusnäytteestä. Uusiin tekoälypohjaisiin videoiden muokkaustyökaluihin kuuluvat virtaviivaistettu leikkaus "Highlights"-toiminnolla ja "Enhance Voice" äänen parantamiseksi.

Tekoälyn Rahoitus ja Liiketoiminta

Elon Muskin xAI ilmoitti virallisesti yhtiön B-sarjan rahoituskierroksesta, jossa kerättiin huimat 6 miljardia dollaria suurilta sijoittajilta haastamaan OpenAI:n ja muut kilpailijat tekoälykilpailussa.
Elon Muskin xAI:n kerrotaan suunnittelevan massiivisen, 100 000 GPU:ta sisältävän supertietokoneen rakentamista, jota kutsutaan "laskennan gigatehtaaksi", tarkoituksenaan nopeuttaa Grok AI -chatbotin kehitystä.
OpenAI solmi monivuotisen sopimuksen News Corpin sisällön lisensoimisesta, mikä mahdollistaa tekoälyn kouluttamisen The Wall Street Journalin, The New York Postin, MarketWatchin ja Barron'sin kaltaisten julkaisujen materiaalilla.
Alphabetin ja Metan kerrotaan tarjoavan miljoonia Hollywood-studioille sisällön lisensoimiseksi tekoälyvideoiden luomiseen tarkoitettujen ohjelmistojen kouluttamiseen.
Applen tulevien WWDC AI -ilmoitusten kerrotaan keskittyvän käytännöllisiin ominaisuuksiin, mukaan lukien "Project Greymatter" -työkalusarja sovelluksille, kuten Safari ja Photos, sekä uudet generatiiviset mukautetut emojit.
Ranskalaisen tekoäly-startup Mistralin kerrotaan laajentavan Yhdysvaltojen markkinoille lisäämällä rekrytointia tarkoituksenaan tarjota yrityksille vaihtoehto suurille tarjoajille, kuten OpenAI:lle ja Googlelle.
Helen Toner kertoi yksityiskohtaisesti väitteistä, joiden mukaan Sam Altman "valehteli suoraan" edelliselle hallitukselle Bilawal Sidhun kanssa tekemässään erikoishaastattelussa. Tonerin mukaan hänet syrjäytettiin sen jälkeen, kun Altman manipuloi muita hallituksen jäseniä.
OpenAI ilmoitti uusista sisältö- ja tuotekumppanuuksista Vox Median ja The Atlanticin kanssa sekä globaalista kiihdyttäjäohjelmasta, jonka tarkoituksena on auttaa julkaisijoita hyödyntämään tekoälyä.
Midjourneyn perustaja David Holz paljasti, että yhtiöllä on uusi laitteistotiimi, mikä tulee aiempien huhujen jälkeen halusta rakentaa "holodeck"-tyyppinen laite.

Tekoälyn Kehitys ja Sovellukset

Lmsys julkaisi uusia suorituskykytuloksia Googlen uusimmille Gemini 1.5 -malleille, joissa Pro/Advanced nousi toiseksi heti GPT-4o:n alapuolelle ja Flash lähestyy GPT-4:ää tulostaulukossa.
Scale AI esitteli SEAL Leaderboards -arviointimittarin, uuden arviointimittarin edistyksellisille tekoälymalleille, jonka tavoitteena on turvallisemmat ja luotettavammat mittaukset.
Tekoälyn voimalla toimiva sovellus Arc Search esitteli "Call Arc" -ominaisuuden, jonka avulla käyttäjät voivat saada nopeita vastauksia pitämällä puhelinta korvallaan ja esittämällä kysymyksen.
Suno julkaisi v3.5-päivityksensä, joka tarjoaa mahdollisuuden luoda pidempiä kappaleita parannetulla rakenteella - vihjailen myös mahdollisuudesta luoda kappaleita tietyistä äänistä.
Google paljasti joukon uusia tekoälyllä varustettuja ominaisuuksia 350 dollarin Chromebook Plus -kannettaviin, joiden tavoitteena on parantaa käyttäjien tuottavuutta, luovuutta ja yhteistyötä.
Microsoft paljasti uuden Copilot Telegram -botin, jonka avulla käyttäjät voivat etsiä, keskustella ja esittää kysymyksiä chatbotille suoraan sovelluksessa.
Ranskalainen tekoäly-startup Mistral julkaisi Codestralin, yhtiön ensimmäisen ohjelmistokehitykseen keskittyvän koodimallin - se päihittää muut koodaukseen keskittyvät kilpailijat tärkeimmissä vertailuissa.
Mr. Beast julkaisi uusia työkaluja ViewStats Pro -sisältöalustallaan, mukaan lukien tekoälyllä toimivan pikkukuvien haun, jonka avulla käyttäjät voivat löytää inspiraatiota luonnollisen kielen kehotteilla.

Tekoäly ja Yhteiskunta

Googlen AI Overviews -ominaisuus meni viraaliksi ehdotettuaan "noin 1/8 kuppia myrkytöntä liimaa" juuston liukumisen estämiseksi pizzasta.
UC San Franciscon tutkijat kehittivät aivoimplantin, joka hyödyntää tekoälyä auttaakseen aivohalvauksesta selvinnyttä kommunikoimaan sekä espanjaksi että englanniksi vaihtaen saumattomasti kielten välillä aivotoiminnan avulla.
Entinen OpenAI:n johtaja ja tekoälyn turvallisuusvastaava Jan Leike ilmoitti liittyvänsä kilpailija Anthropiciin - johtaen uutta superlinjaustiimiä, joka keskittyy turvallisuuteen ja suojaukseen.
Tutkijat esittelivät SignLLM:n, ensimmäisen monikielisen viittomakielen tuottamiseen (SLP) kykenevän tekoälymallin, joka pystyy luomaan avatarien videoita viittomakielen eleistä kaikilla kahdeksalla kielellä.
Meta AI:n johtaja Yann LeCun sanoi, että suuret kielimallit eivät koskaan saavuta ihmisen tasoista älykkyyttä, ja argumentoi sen sijaan tekoälyn "maailman mallintamisen" lähestymistavan puolesta, joka saattaa kestää 10 vuotta saavuttaa.
Chicagon yliopiston uudessa tutkimuksessa havaittiin, että suuret kielimallit, kuten GPT-4, voivat onnistuneesti suorittaa tilinpäätösanalyysin ja jopa ylittää ihmisanalyytikot tulevien tuottojen suunnan ennustamisessa.

Teknisille ihmisille

Top GitHub-repot
- PR-Agent (☆ 4.5k)
  - PR-Agent on kokoelma työkaluja ja ominaisuuksia, jotka on rakennettu hyödyntämään kielimalleja erilaisten koodin tarkistukseen ja kehitystyönkulkuihin liittyvien tehtävien avustamisessa yhteistyöhön perustuvassa ohjelmistoympäristössä.
- RT-DETR (☆ 1.5k)
  - Tämä repo on virallinen toteutus paperille "DETRs Beat YOLOs On Real-Time Object Detection". Se esittelee Real-Time DEtection TRansformer (RT-DETR, aka RTDETR) -mallin, joka on ensimmäinen reaaliaikainen end-to-end kohteiden tunnistin. Se suoriutuu sekä nopeudessa että tarkkuudessa paremmin kuin aiemmin edistyneet YOLO-mallit.
- Tarsier (☆ 1.1k)
  - Tarsier on työkalupaketti, joka ratkaisee seuraavat ongelmat liittyen kielimallien käyttöön web-vuorovaikutuksessa: Verkkosivun syöttäminen kielimallille (HTML, saavutettavuuspuu, kuvakaappaus), kielimallien vastausten yhdistäminen takaisin web-elementteihin, vain tekstiä käsittelevän kielimallin informoiminen sivun visuaalisesta rakenteesta.

Viikon AI-työkalu

D-ID

D-ID mahdollistaa käyttäjille elävän näköisten puhuvia päitä esittävien avatareiden luomisen pelkästä staattisesta muotokuvasta ja käsikirjoituksesta.

Rekisteröidy ilmaiseksi D-ID:hen ja saat bonuspisteitä.
Klikkaa "Create" ja valitse "Video" päästäksesi videon luomissivulle.
Valitse valmiiksi luotu esittäjä, luo ainutlaatuinen tekoäly-avatar tai lataa kuva.
Kirjoita käsikirjoitus ja mukauta avataria kieli-, ääni- ja tyylivaihtoehdoilla.
Klikkaa "Create video" herättääksesi valokuvan eloon!

Viikon Chatbot-vinkki

Koukut eli hookit ovat kaiken sisällöntuotannon tärkein osa. Se tarkoittaa sisällön otsikkoa tai ensimmäistä 1-2 lausetta, mikä koukuttaa katsojan katsomaan koko sisältösi. Tässä teille kehote miten muuttaa geneerinen koukku esim. “vinkkejä sisällöntuotantoon” megakoukuksi, joka nostaa sisältösi näyttökertoja!

Korvaa vain [LISÄÄ GENEERINEN OTSIKKO] -kohta tässä kehotemallissa tylsällä koukulla, jota haluat piristä:

Ole hyvä ja muuta seuraava geneerinen otsikko mukaansatempaavaksi, klikattavaksi versioksi:
"[LISÄÄ GENEERINEN OTSIKKO]"
Uuden otsikon tulisi sisältää seuraavat elementit:
Tarkkuus: Tarkenna tiettyä kipupistettä, hyötyä, strategiaa tai lopputulosta, joka liittyy aiheeseen. Mitä tarkempi ja konkreettisempi, sen parempi.
Esimerkki muunnoksesta:
Geneerinen: "Kuinka parantaa tuottavuuttasi"
Tarkka: "3 tuottavuusvinkkiä, jotka auttoivat minua suorittamaan tehtäväni kaksi kertaa nopeammin"
Uteliaisuus: Herätä mielenkiintoa vihjaamalla odottamattomasta oivalluksesta, vastakkaisesta näkemyksestä tai sisäpiirin salaisuudesta. Saa ihmiset ajattelemaan: "Ooh, kerro lisää!"
Esimerkki muunnoksesta:
Geneerinen: "Vinkkejä parempaan uneen"
Utelias: "Yllättävä nukkumaanmenotapa, joka sabotoi untasi (ja kuinka korjata se)"
Toiminnallisuus: Viittaa selkeään, saavutettavissa olevaan tulokseen tai lopputulokseen, jota lukija voi odottaa sisällön kuluttamisesta. Keskity muutokseen.
Esimerkki muunnoksesta:
Geneerinen: "Kuinka säästää rahaa ruokaostoksissa"
Toiminnallinen: "Kuinka leikkasin ruokalaskuni 50 %:lla uhraamatta laatua tai makua"
Tunne: Vetoaa lukijan tunteisiin käyttämällä voimasanoja, aistiyksityiskohtia tai tarinankerronnan elementtejä. Saata heidät tuntemaan jotain.
Esimerkki muunnoksesta:
Geneerinen: "Vinkkejä onnistuneeseen työhaastatteluun"
Tunteellinen: "Itseluottamusta lisäävä niksi, joka auttoi minua onnistumaan unelmatyöhaastattelussani (jopa hikisillä kämmenillä)"
Ole hyvä ja luo 3 mukaansatempaavaa otsikkovaihtoehtoa, joista valita.
Jokaiselle vaihtoehdolle, anna lyhyt selitys siitä, miksi se toimii ja miten se sisältää yllä mainitut elementit.
Pidä otsikot alle 20 sanassa ja vältä käyttämästä kliseitä tai liioittelua.