Uusi tekoäly voi toimia kirjailijana tai ainakin tuottaa lyhyttä tekstiä itsenäisesti
Ehkä kirjailijana toimiminen on tekoälylle vielä hiukan liian vaikeaa, mutta liikekirjeen algoritmi osaa kyllä luoda. Tekstin yläpuolella on kuva liikekirjeen mallista, ja jos tekoälyn halutaan luovan vastauksen tähän kirjeeseen, niin silloin sen pitää vain etsiä kohdat, missä on muuttujia, ja sen jälkeen näiden muuttujien ympärille luodaan tekstiä, mikä saa vastauksen näyttämään aidolta ihmisen luomalta kirjeeltä.
Tekoäly on hyvin tehokas väline silloin kun se tekee kaavamaista tekstiä, ja sen takia esimerkiksi liikekirjeen teko sujuu siltä ehkä vähän liiankin hyvin. Eli jos tietokoneen pitää automaattisesti antaa myöntävä vastaus johonkin tällaiseen kirjeeseen, niin silloin sen pitää vain poimia yläkentässä olevat lähettäjän tiedot, ja sitten asettaa ne oikeisiin kohtiin valmista tekstin pätkää. Ja sitten kun käsittelijä painaa “kyllä” tai “ei” nappia, niin silloin valitaan tekstipohja, johon vain nuo muuttujat asetetaan.
Ja jos sitten halutaan tehdä virheenkorjaus, niin tämä tekoäly voi esimerkiksi käyttää postin tietokantaa siihen, että se löytää osoiterivin. Muun tiedon se sitten voi tunnistaa tiedon muodosta, ja sen jälkeen tekoäly vain sijoittaa nuo tiedot oikealle paikalle. Tunnistaminen tapahtuu siten, että kone vertaa jokaista tietoa esimerkiksi postin osoitteeseen, jotta se löytää osoite kohdan.
Sitten postinumero löytyy numeron pituuden perusteella, eikä henkilön oikeassa nimessä ole varmaan @ merkkiä, mutta nimen tuo ohjelma voi muodostaa etsimällä sähköpostiosoitteen ja siinä olevan kaksi sanaa, mitkä ovat pisteen molemmin puolin ovat henkilön nimet. Tämä virheen korjaus on sen takia että jos vaikka lähettäjä laittaa tietoja väärään järjestykseen niin vastauksessa ne ovat oikeassa järjestyksessä. Eli muistakaa että tietokone ei ole ihminen, se on kone mille kaikki pitää oikeastaan opettaa.
Ja siksi sille pitää vääntää rautalangasta kaikki mitä se tekee. Se mitä me pidämme luonnollisena kuten nimen erottaminen tekstistä on tietokoneelle mahdotonta, jos sille ei ole luotu algoritmia tätä asiaa varten. Kaikki algoritmit ovat ohjelmoijien tekemiä, ja jos me sanomme ihmiselle että “katso vain tiedot ylätunnisteesta”, niin tietokoneelle pitää opettaa se, miltä nimi näyttää tai miltä näyttää postinumero sekä se mitä tarkoittaa “ylätunniste”. Se miten tietokonetta opetetaan on se, että johonkin kohtaan tässä tapauksessa asiakirjaa liitetään attribuutti joka määrittelee mitä toimintoja kyseiseen kohtaan tai kuvaan liittyy.
-------------------------------------------------------------------------------------
Tekoäly luo aidon näköistä tekstiä.
Kykeneekö GTP-3 tekemään twiittejä, tai luomaan myös pidempiä tekstejä? Eli vaikka kyseessä olisi vain twiittien luomiseen sopiva ohjelma, niin silti GTP-3 on suuri harppaus tietojenkäsittelyssä sekä tekoälyn tutkimuksessa.
GPT-3 tekoäly luo tekstiä käyttämällä Internetistä kaivettua dataa tuotoksen tekemiseen, ja itse olisin halunnut tietää että käyttääkö tämä tekstin tuottamiseen kehitetty ohjelma staattista tai dynaamista tietokantaa? Staattinen tietokanta tarkoittaa sitä että ohjelmassa on valmiiksi ladattu joukko sanoja, joita se sitten yhdistää, ja dynaaminen tietokanta tarkoittaa sitä että ohjelmaan on kiinnitetty hakurobotti joka on hakee tietoa internetin kautta.
Tuo jälkimmäinen tarkoittaa sitä että kyseinen ohjelma voisi kirjoittaa tekstiä jokaisesta mahdollisesta aiheesta. Tässä tapauksessa tekoäly luo tekstin siten, että se asettaa tiettyjä sanoja tiettyyn järjestykseen sillä tavoin kuin sen saama tehtävä vaatii. Jos ohjelma saa käskyn kirjoittaa kuvaus jostain aiheesta, niin se etsii silloin esimerkiksi joukon kotisivuja, joissa on tietoa kyseisestä aiheesta.
Eli jos tehtävä olisi “kuvaile New Yorkia”, niin silloin tekoäly tietenkin on sikäli rajoittunut, että se on riippuvainen siitä, mitä ohjelman tietokantaan on tallennettu, ja miten se tietoa hakee. Tuolloin tietokone voi käyttää esimerkiksi kaupunkikuvaa, ja etsiä sieltä taloja, joiden kuvia se vertaa tietokannassa oleviin kuviin sekä niihin liitettyihin sanoihin. Ja tulos voisi olla se, että tietokone kirjoittaa että kaupungissa on niin ja niin paljon ihmisiä, se sijaitsee siellä ja siellä sekä siellä on paljon pilvenpiirtäjiä, sekä myös esimerkiksi tietoja siitä mikä on korkein talo. Tuon tiedon tietokone voi hakea vertaamalla siis valokuvissa näkyviä komponentteja sen tietokannassa oleviin kuviin sekä sanoihin, jotka on liitetty kuviin.
Samoin se voi käyttää myös esimerkiksi hakukonetta joka etsii silloin tietoa algoritmeillä “maailman korkein rakennus” tai “(annettu kaupungin nimi) korkein rakennus”. Tuollainen ohjelma saattaa vaikuttaa siltä, että se aivan oikeasti ajattelee, kun se kirjoittaa rivin “New York on kaupunki, missä asuu (X määrä) ihmisiä, ja jossa on paljon pilvenpiirtäjiä, joiden korkeus on (joko tuntematon tai netistä saatu luku), mutta maailman korkein rakennus ei ole niiden joukossa). Tuolloin kyseessä on ohjelma mikä sijoittaa oikeita sanoja oikeisiin kohtiin. Eli se voi hakea suluissa merkittyjä arvoja suoraan internetistä, ja jos sitten arvoa ei löydy, niin vastaus on “korkeus tuntematon”.
Jos henkilö antaa saman tehtävän useita kertoja, vaihtaen kaupungin nimiä, niin silloin hän saattaa huomata sen, että vastaus on periaatteessa aina sama, mutta kaupungin nimi vain vaihtuu. Mikäli sitten kyse on kaupungista, missä maailman korkein rakennus sijaitsee, niin silloin ohjelma voi antaa vastauksen, “maailman korkein rakennus 828 metriä korkea Burj Khalifa sijaitsee tässä kaupungissa”. Eli tuolloin kaupungin nimen kohdalle on tehty poikkeava vastaus.
Tämä on siis rautalankamalli ohjelmasta tai algoritmistä joka kirjoittaa kuvauksia kaupungeista. Mutta tietenkin mitä laajemman tehtävien joukon tuo algoritmi sitten voi suorittaa on riippuvainen siitä miten se osaa tietoa hakea. Eli se että kone osaa tuottaa tekstiä itsenäisesti voidaan tehdä niin, että kone indeksoi kirjaimia tai sanoja. Tuo termi tarkoittaa sitä, että kieliopissa tiettyjä sanoja tai sanajärjestyksiä käytetään tietyssä yhteysdessä. Ja sen avulla sitten tekoäly luo tekstiä mikä näyttää hyvin aidolta, ainakin ensi näkemältä.
Siis tekoälyn ongelma on siinä että mitä laajempi tuon ohjelman tuottaman tekstin skaala on, niin sitä suurempi tietokanta tai monimutkaisempi algoritmi sillä pitää olla, jos sen halutaan hakevan tietoa suoraan netistä, jotta se voisi tuottaa vaikkapa liikekirjeen, koska liikekirjeet tehdään tietyn kaavan mukaan. Silloin ohjelmassa on määritys siitä että mitä kirjeessä pitää olla, ja mitä siinä ei saa olla. Tuolloin ohjelmalle annetaan käsky, että kirjoita vastaus siitä, onko joku tarjous hyväksytty vai ei.
Näin ohjelma luo tekstin sen kaavan mukaan, missä vastaus on hyväksyvä. Ja se miten tuo työ tehdään niin, että vastaus näyttää yksilölliseltä on se, että jokainen kirje saa järjestysnumeron, ja sitten käsittelijä voi käyttää yksinkertaista lomaketta, missä on napit “kyllä” tai “ei”. Sen jälkeen ohjelma sitten luo vastauksen liittämällä valmiiseen teksti malliin esimerkiksi sen mitä lukee sanan “tarjous” tai “asia” (“subject”) sekä “lähettäjä” takana. Tuon jälkeen tekoäly liittää siihen vain tietyn tekstin, jossa sitten tietyt asiat kuten sen nimi, jolle vastataan muutetaan. Ja sen takia vastaus sitten saadaan näyttämään henkilökohtaiselta, vaikka kyseisen tekstin on luonut tekoäly.
Ei kommentteja:
Lähetä kommentti
Huomaa: vain tämän blogin jäsen voi lisätä kommentin.