AI žemėlapis supaprastintas 2 dalis: kaip GenAI iš tikrųjų veikia praktikoje

Nuo GenAI supratimo iki ekosistemos žemėlapio (be techninių detalių)

Pirmajame įraše apžvelgiau, kur GenAI yra AI kraštovaizdyje: AI → ML → DL → GenAI. Tai atsakė į klausimą „kas yra GenAI?“. Dabar kyla praktinis klausimas: „kaip GenAI iš tikrųjų veikia, kai jį naudoju?”

Norėdamas atsakyti į tai, turiu struktūrizuoti visus kitus ekosistemos dalyvius: įgalintojus, platformas, programas. Čia dažnai pasimetu, nes visi maišo programėles, LLM ir įmonių pavadinimus, ir nėra aišku, kas yra kas. Todėl vėl atidarau Excel.

Atlikau tą patį žemėlapio pratimą GenAI ekosistemai. Štai ką sukūriau.

Paprastas žemėlapis

GenAI turi tris sluoksnius, kurie veikia kartu:

Ir taip, žinau, kad Excel nebuvo sukurtas tam, bet senos įpročiai sunkiai miršta, ir tai veikia.

Kaip jie susiję: programos kviečia modelius per platformas. Jūsų duomenys ir kontrolė yra platformos lygyje.

Ką iš tikrųjų daro kiekvienas sluoksnis

Modeliai — Smegenys

Tai yra tikrosios AI sistemos, kurios generuoja tekstą. GPT-5, Claude 4.5, Gemini Pro—tai yra „smegenys“, kurios mokėsi iš didžiulių tekstų kiekių ir dabar gali rašyti, apibendrinti ir samprotauti. Galvokite apie juos kaip apie labai sudėtingus prognozavimo variklius, gyvenančius debesyje.

Platformos — Saugus šeimininkas

Modeliams reikia vietos, kur jie galėtų saugiai veikti įmonės mastu. AWS Bedrock, Azure OpenAI Service ir Google Vertex AI yra kaip saugūs duomenų centrai, kurie talpina modelius, tuo pačiu pridedant verslo kontrolę: leidimus, registravimą, duomenų buvimo vietą, atitikties sistemas.

Programos — Sąsaja

Tai yra tai, ką jūs iš tikrųjų spaudžiate. ChatGPT, Microsoft Copilot, Gemini for Workspace, Moterra Business AI Suite. Jie priima jūsų įvestį, siunčia ją modeliui (per platformą) ir rodo jums atsakymą patogiu būdu.

RAG — Paieška

RAG vienoje eilutėje: Kai kurios programos gali „ieškoti“ jūsų vidiniuose dokumentuose ir perduoti modelio atitinkamas dalis kartu su jūsų klausimu.
Kai klausiu Moterra Business AI Suite „Kokia mūsų nuotolinio darbo politika?“, pirmiausia ieško mūsų SharePoint, tada prašo Claude 3.5 atsakyti remiantis mūsų faktinėmis politikomis. Tai yra Retrieval-Augmented Generation—atsakymai pagrindžiami jūsų turiniu, o ne bendrais mokymo duomenimis.

Kodėl visi sluoksniai yra svarbūs

Matau skelbimus, straipsnius ir pokalbius, kur įmonių pavadinimai, modelių pavadinimai ir programų pavadinimai nuolat maišomi. Klientas neseniai man pasakė „GPT man duoda geresnius atsakymus nei Copilot“ – nors iš tikrųjų jis turėjo omenyje ChatGPT programą, kuri gauna geresnius atsakymus nei Copilot programa. Abu naudoja tuos pačius GPT modelius, todėl šiuo atveju skirtumą daro programos sluoksnis.

Man, šių trijų sluoksnių supratimas buvo raktas į tai, kaip GenAI iš tikrųjų veikia. Atsakymų kokybė priklauso nuo visų trijų sluoksnių ir kaip jie yra sukonfigūruoti kartu – modelio, platformos ir programos derinys yra svarbus. Be to, kai kuriose programose deriniai yra fiksuoti, kai kuriose lankstūs.

Fiksuoti deriniai: ChatGPT naudoja tik OpenAI modelius. Jūs negalite pakeisti.
Lankstūs deriniai: Moterra gali keisti tarp Claude ir GPT-4, priklausomai nuo to, kas geriausiai tinka jūsų naudojimo atvejui. Perplexity naudoja kelis modelius ir pasirenka geriausią kiekvienam užklausai.

Kai kas nors kuria programą, jie pasirenka modelį ir platformą, ir nusprendžia, kiek lankstumo įdiegti. Daugiau lankstumo reiškia daugiau sudėtingumo, todėl kai kurie kūrėjai renkasi paprastumą ir fiksuoja vieną modelį.

Šių trijų sluoksnių supratimas padeda pamatyti, kas iš tikrųjų yra bet kokio AI įrankio viduje – ir kas galima pakeisti, o kas yra fiksuota.

Kaip tai veikia praktikoje: Moterra istorija

Kliento IT komanda atliko tinklo analizę ir nustatė, kad darbuotojai visą dieną įkelia įmonės dokumentus į asmenines ChatGPT paskyras. Efektyvumo padidėjimas buvo akivaizdus, bet taip pat ir atitikties rizika. Būtent dėl to sukūrėme Moterra Business AI Suite tokiu būdu.

Pasirinkome Claude 3.5 kaip mūsų modelį, nes jis puikiai supranta sudėtingus verslo dokumentus. Mes jį paleidžiame per AWS Bedrock, nes mūsų klientams reikia, kad jų duomenys liktų kontroliuojamoje aplinkoje su tinkamu registravimu ir atitiktimi. Mūsų programos sluoksnis tvarko SharePoint integraciją, todėl kai kas nors klausia „Kokia mūsų nuotolinio darbo politika?“, pirmiausia ieško jų faktinių dokumentų, tada siunčia tiek klausimą, tiek atitinkamas politikos dalis Claude.

Rezultatas? Tokios pačios kokybės atsakymai kaip asmeniniame ChatGPT, bet viskas lieka jų saugumo perimetre ir gerbia jų esamus prieigos kontrolės. Be to, jei Claude nustoja gerai veikti konkrečiam naudojimo atvejui, galime pereiti prie GPT-5 be visko iš naujo kūrimo, tai yra lankstumas suprantant visus tris sluoksnius.

Kai aiškiai matote modelio → platformos → programos struktūrą, sprendimai apie tai, kas veikia jūsų situacijai, tampa daug paprastesni.

Mano išvada

Pirmajame įraše apžvelgiau AI kraštovaizdį: Dirbtinis intelektas yra pagrindas. Mašininis mokymasis yra metodas. Gilus mokymasis yra variklis. Generatyvinis AI yra tai, kas kuria.

Dabar žinome, kas vyksta, kai iš tikrųjų naudojame GenAI: modeliai teikia samprotavimus, platformos tvarko saugumą, programos suteikia sąsają. Žemėlapis tampa aiškesnis.

Naujausi įrašai

Kaip analizuoti pasikartojančias pajamas: išsamus ARR ir MRR vadovas

Pasikartojančios pajamos nėra tik metrika. Tai yra verslo vertinimo, investuotojų pasitikėjimo ir strateginio planavimo pagrindas. Nors daugelis įmonių seka metines

Kaip sudaryti pinigų srautų prognozę: išsamus vadovas

82% mažų įmonių žlunga dėl pinigų srautų problemų. Ši statistika yra nerimą kelianti, nes daugumą šių nesėkmių būtų galima išvengti