Luin Harvard Business Review’sta pitkän jutun, aiheena tekoäly ja koneoppiminen liiketoiminnassa. Seuraavassa siitä tekemäni muistiinpanot, lähinnä vapaasti käännettyjä kohtia mielestäni oleellisimmista jutuista. Joidenkin kappaleiden aiheita olen jättänyt tyystin pois.
Kirjoitin mukaan pari esimerkkiä töideni saralta. Erottelin nämä tekstiin lainauksina (harmaa laatikko, jossa teksti sisennettynä) ja kirjoittamalla tekstin alkuun esimerkki. Työskentelen Elinarissa, jossa teemme tekoäly- ja koneoppimisratkaisuja sisällönhallintaan liittyen, ja esimerkkini ovat tältä työmaalta.
Jos haluat lukea HBR:n jutun kokonaisuudessaan (se on pitkä, mutta mielenkiintoinen!), niin se löytyy täältä: The Business of Artificial Intelligence.
Tekoäly, koneoppiminen ja liiketoiminta
Tekoäly ja koneoppiminen mullistavat tulevina vuosikymmeninä valmistuksen, kuljetuksen, rahoituksen, terveydenhuollon, koulutusalan ja käytännössä jokaisen muunkin alan. Pullonkaulana ovat tällä hetkellä johtaminen, käytännön soveltaminen sekä mielikuvitus.
Mitä tekoäly tekee jo nyt?
Kaksi merkittävintä edistysaskelta on tapahtunut havaitsemisen ja kognitiivisten ominaisuuksien saralla.
Tekoäly pystyy tunnistamaan puhetta, vaikkakaan ei ole siinä täydellinen. Esimerkkejä ovat Siri ja Google Assistant. Stanfordin yliopiston tutkijan James Landayn ja tämän kollegoiden tutkimuksen mukaan puhetunnistus on keskimäärin kolme kertaa nopeampaa kuin viestien kirjoittaminen älypuhelimella.
Myös kuvantunnistus on kehittynyt valtaisasti. Esimerkiksi Facebook pyrkii tunnistamaan kuvista kavereitamme – ja usein onnistuukin siinä varsin hyvin. Itseajavissa autoissa käytetyt sensorit tekivät aikaisemmin yhden virheen 30 kuvan aikana, kun niiden piti tunnistaa jalankulkijoita. Nyt ne tekevät virheen harvemmin kuin kerran 30 miljoonan kuvan aikana. Tekoälylle voi silti olla vielä paikoin hankalaa erottaa muffinssi chihuahuasta.
Kongitiivisten ominaisuuksien kehitys
Tekoäly on valjastettu esimerkiksi havaitsemaan haittaohjelmia, estämään rahanpesua, auttamaan vakuutusyhtiöiden korvausvaatimusprosesseissa sekä toimimaan asiakaspalvelijana. Syväoppimisjärjestelmät on laitettu myös skannaamaan kuvia, ja diagnosoimaan niistä syöpää.
Esimerkki: Tekoäly taiteilijana. Opetimme tekoälylle, miten Edward Munch on maalannut kuuluisan Huuto-teoksensa. Erään tilaisuutemme osallistujat ottivat kuvia itsestään ja laitoimme tietokoneen muokkaamaan noista kuvista Huudon näköisiä. Tarkkuus ei ollut huipussaan, koska kutakin kuvaa käsiteltiin viitisen minuuttia. Kuvassa alla minä ja myyntipäällikkömme tällaisessa taideteoksessa.
Koneoppimisjärjestelmät tekevät kuitenkin vain hyvin tarkkaan määriteltyjä asioita. Tekoälyn kyvykkyyttä on alettu liioitella, koska on kuviteltu, että tämä yhdessä asiassa toimiva erinomaisuus olisi helposti yleistettävissä: että tekoäly pystyisi helposti ottamaan haltuun kaikenlaista osaamista.
Miten koneoppiminen toimii
Koneita ei enää koodata, vaan ne oppivat erilaisista malleista. Koodaamisella tarkoitetaan prosessia, jossa kehittäjä siirtää tietoaan tietokoneen suoritettavaksi. Keskeinen heikkous tässä on kuitenkin se, että tiedämme paljon sellaisia asioita, joita emme osaa täysin selittää. Emme pysty esimerkiksi laatimaan toiselle ihmiselle ohjetta siitä, miten tämä pystyisi tunnistamaan toisen ystävämme kasvoista (vaikkapa tuhannen ihmisen joukosta).
Tekoälyn ja koneoppimisen kehittäminen on viime aikoina tapahtunut lähinnä valvottujen oppivien järjestelmien (supervised learning system) avulla. Tekoälylle annetaan jonkinlainen ongelma ja sen ratkaisuksi paljon materiaalia, josta se voi oppia oikean vastauksen. Sille voidaan syöttää esimerkiksi kissan kuvia ja samalla luokitella nämä kuvat kategoriaan ”kissa”. Kun materiaalia on paljon, kone oppii tunnistamaan kissojen eri piirteitä ja osaa yhä paremmin tuottaa kissakuvan tulosteena kategorian ”kissa”.
Tekoälyn kehitystä merkittävästi edesauttaneita algoritmeja kutsutaan syväoppiviksi, ja ne käyttävät apunaan neuroverkkoja. Syväoppivat algoritmit kykenevät käyttämään apunaan huomattavasti aikaisempaa enemmän dataa. Aikaisemmin oppivat järjestelmät pystyivät oppimaan vain tiettyyn rajaan asti, mutta sitten kehitys pysähtyi. Syväoppivat järjestelmät eivät pysähdy näin: Mitä enemmän dataa, sitä paremmin ne toimivat. Isoimpia järjestelmiä on koulutettu 36 miljoonan esimerkin voimin.
Mitä enemmän dataa tarvitsee käsitellä, sitä enemmän tarvitaan laskentatehoa. Siksi näissä yhteyksissä puhutaan supertietokoneista ja erityisistä tietokoneratkaisuista.
Esimerkki: Meillä on käytössä IBM:n Power-arkkitehtuuriin ja Nvidian näytönohjaimiin sekä väyläratkaisuihin perustuva supertietokone ”Minsky”, jota tarvitaan tehokkaita koneoppivia järjestelmiä varten. Lue lisää IBM:n julkaisemasta jutusta.
Jeff Wilken, joka johtaa Amazonin kuluttajabisnestä, mukaan valvotut oppimisjärjestelmät ovat pääsääntöisesti korvanneet muistiperustaiset suodatusalgoritmit. Näitä käytettiin luomaan henkilökohtaisia suosituksia asiakkaille.
Datan kategorisointi on verrattain helppoa, joten siksi valvottuja oppimisjärjestelmiä käytetään valvomattomien sijaan. (Ihmiselle on helppoa tunnistaa ennen näkemättömiä puita ulkomailla, mutta koneelle tämä ei ole helppoa.) Kun pystymme kehittämään tehokkaita valvomattomia järjestelmiä, edessämme on hurjasti uusia mahdollisuuksia. Tällaiset järjestelmät pystyvät esimerkiksi katsomaan monimutkaisia ongelmia uusista näkökulmista ja tuomaan niistä esille malleja, joita emme ole huomanneet – oli kyse sitten tautien leviämisestä tai asiakkaiden käyttäytymisestä.
Pieni mutta kasvava alue on vahvistava opetus (reinforcement learning). Tätä lähestymistapaa on käytetty esimerkiksi niissä järjestelmissä, jotka ovat oppineet pelaamaan videopelejä tai Go’ta mestarillisesti. Tällaisissa järjestelmissä ohjelmoija määrittelee nykytilanteen, päämäärän ja listan sallituista toiminnoista. Ohjelmoija myös kuvaa noita toimintoja rajoittavat elementit. Tämän jälkeen järjestelmä selvittää, miten sallituilla toiminnoilla päästään haluttuun lopputulokseen tai mahdollisimman lähelle sitä.
Nämä järjestelmät toimivat hyvin, jos ihmisillä on tiedossa jokin määränpää, mutta ei tiedetä, miten sinne päästä. Esimerkiksi Microsoft on hyödyntänyt tällaista järjestelmää valitsemaan MSN.comin uutisotsikot palkitsemalla järjestelmää sitä isommilla pisteillä, mitä useammin käyttäjät klikkasivat uutista. Järjestelmä pyrki maksimoimaan pisteensä ohjelmoijien määrittelemien sääntöjen puitteissa. Nämä järjestelmät pystyvät siis optimoimaan itsensä haluttujen päämäärien valossa, mutta valittu päämäärä ei välttämättä olekaan oikean. Sen valinnan kanssa täytyykin olla tarkkana.
Koneoppiminen toiminnassa
Kolme hyvää uutista yrityksille, jotka haluavat hyödyntää koneoppimista:
- Tekoälyosaaminen leviää nopeasti.
- Tarvittavat algoritmit ja laitteistot voidaan ostaa tai vuokrata.
- Et ehkä tarvitse niin paljoa dataa, jotta voit hyödyntää koneoppimista.
Koneoppiminen tarkentuu sen mukaan, mitä enemmän dataa on käytössä. Siksi on loogista ajatella, että ne yritykset menestyvät, joilla on eniten dataa. Tämä ajatus pätee lähinnä maailmanmarkkinoiden dominoinnissa yhden toiminnon kohdalla. Jos menestyksellä tarkoitetaan kuitenkin suorituskyvyn merkittävää paranemista, tähän tarvittava data on yleensä varsin helppoa saada käsiin.
Koneoppiminen tuo muutoksia kolmella tasolla:
- Tehtävissä (esim. konenäön käyttäminen syöpäsolujen tunnistamisessa)
- Liiketoimintaprosesseissa (esim. työnkulun uudelleenmäärittely Amazonin täydennyskeskuksissa, joissa otettiin käyttöön koneoppimiseen perustuvat robotit ja algoritmit)
- Liiketoimintamalleissa (esim. palvelu, joka perustuu täysin koneoppimisen suosittelemiin elokuviin tai musiikkiin – henkilökohtainen musiikki- tai leffakanava, joka ennustaa, mitä kuluttaja haluaa riippumatta siitä, onko tämä koskaan nähnyt / kuullut vastaavaa)
Koneoppiminen ei kuitenkaan juuri koskaan korvaa koko tehtävää tai työnkuvaa, prosessia tai liiketoimintamallia. Yleensä se täydentää ihmistoimintoja. Harvoin jos koskaan, paras tapa hoitaa työt tulee olemaan ”annetaan kaikki työt koneelle”. Sen sijaan vaikkapa prosessin kymmenestä askelmasta yksi tai kaksi voidaan hoitaa tehokkaamman koneen hoidettavaksi.
Tällainen lähestymistapa on yleensä parempi kuin sellaisten koneiden kehittäminen, jotka osaisivat tehdä kaiken, mitä ihminen osaa. Ihmisen ja koneen yhdessä tekemä työ tekee työstä miellyttävämpää (kun rutiininomaisten vaiheiden sijaan voi keskittyä monimutkaisempiin asioihin). Tämä johtaa edelleen parempiin lopputulemiin asiakkaille.
Riskit ja rajoitukset
Koneoppimisjärjestelmien ratkaisuja on yleensä vaikea tulkita. Ihminen ei pysty yleensä päättelemään, miten järjestelmä on tehnyt ratkaisunsa. Koneet ovat tehokkaita päättelemään, mutta ne eivät osaa kertoa meille, miten ovat päätyneet tiettyyn lopputulemaan.
Koneissa voi olla piilotettuja vinoumia, jotka syntyvät opetukseen käytetystä datasta. Jos koneelle vaikkapa opetetaan, millaisia rekrytointipäätöksiä ihmiset ovat aikaisemmin tehneet, konerekrytoija saattaa alkaa suosimaan tiettyä sukupuolta tai etnistä taustaa (koska koulutusdatassa sattuu olemaan tietty painotus).
Neuroverkot toimivat tilastollisten totuuksien mukaan sen sijaan, että ne seuraisivat loogisia sääntöjä. Tämän vuoksi on vaikeaa tai jopa mahdotonta olla täysin varma siitä, että järjestelmä toimii kaikissa tapauksissa – Etenkin sellaisissa, joita opetusdatassa ei ole ollut. Todennettavuuden puute olisi erityisen ongelmallista esimerkiksi ydinvoimalan ohjausjärjestelmässä tai muissa tapauksissa, joissa on kyse ihmishengistä.
Jos ja kun koneoppimisjärjestelmä tekee virheitä, näiden virheiden diagnosointi on hyvin vaikeaa. Tämä siksi, että järjestelmän ratkaisujen taustalla on äärettömän monimutkainen rakennelma.
Täytyy kuitenkin huomata, että myös meidän ihmisten ajattelussa on vinoumia. Myös me teemme virheitä. Myös meidän voi olla hankala kertoa, miten olemme tulleet johonkin päätökseen.
Mitä tekoäly ja koneoppiminen eivät voi tehdä?
Usein kuullaan puhuttavan, että tekoäly ei pysty koskaan arvioimaan meitä emotionaalisia ja epäjohdonmukaisia ihmisiä. Koneoppimisjärjestelmät, kuten Affectiva pystyvät kuitenkin jo nyt tulkitsemaan ihmisen emotionaalista tilaa äänensävyn ja kasvonpiirteiden perusteella – Jopa paremmin kuin ihminen. Toiset järjestelmät pystyvät kertomaan, koska maailman parhaat pokerinpelaajat bluffaavat.
Tietokoneet ovat hyviä antamaan vastauksia, mutta huonoja kysymään. Tarvitaan siis yrittäjiä, keksijöitä, tutkijoita ja muita, jotka määrittelevät, mitä ongelmia tai mahdollisuuksia on tutkittava seuraavana.
Siinä on hurja ero, pystymmekö passiivisesti tulkitsemaan toisen henkistä tilaa ja toisaalta aktiivisesti muuttamaan sitä. Koneoppivat järjestelmät alkavat olla melko hyviä ensin mainitussa, mutta meitä suuresti jäljessä viimeksi mainitussa. Ihminen kykenee myötätuntoon ja solidaarisuuteen – ja siten motivoimaan ja inspiroimaan, kone ei.
TED-konferenssissa 2014 julkistettiin eräs palkinto. Sen saa ensimmäinen tekoäly, joka tulee TED Talk -lavalle pitämään puheen, jolle yleisö antaa aplodit seisaaltaan. Tätä palkintoa tuskin jaetaan kovin pian.
Vallitseva tila, jossa työ jaotellaan mielien ja koneiden tehtäväksi, murenee nopeasti. Yritykset, jotka pidättäytyvät tässä ajatuksessa, huomaavat pian menettäneensä valtavasti kilpailuetua verrattuna niihin, jotka hyödyntävät koneoppimista täysillä.
Liiketoiminnan maailmassa on alkanut valtava muutos. Kuten höyryvoiman ja sähkön kanssa, kyse ei ole siitä, kuka pääsee käsiksi uusiin teknologioihin. Kyse ei ole edes siitä, kenellä on parhaat teknologiat. Sen sijaan voittajat eroavat häviäjistä sillä, että ne kykenevät olemaan avoinmielisiä, näkemään ohi status quon ja kuvittelemaan täysin uudenlaisia lähestymistapoja.
Yksi suurimmista koneoppimisen perinnöistä voi tulla olemaan aivan uudenlaisten liiketoimintajohtajien sukupolvi.
2 vastausta artikkeliin “Tekoäly, koneoppiminen ja liiketoiminta”