Как работи изкуственият интелект?

Как работи изкуственият интелект?

Изкуственият интелект може да се усеща като магически трик, на който всички кимат, докато тихо си мислят... чакайте, как всъщност работи това? Добри новини. Ще го демистифицираме без излишни приказки, ще останем практични и ще добавим няколко несъвършени аналогии, които все пак го правят разбираем. Ако искате само същността, преминете към едноминутния отговор по-долу; но честно казано, детайлите са мястото, където крушката светва 💡.

Статии, които може да ви харесат след тази:

🔗 Какво означава GPT
Кратко обяснение на акронима GPT и неговото значение.

🔗 Откъде изкуственият интелект получава информацията си
Източници, които ИИ използва, за да учи, обучава и отговаря на въпроси.

🔗 Как да внедрите изкуствен интелект във вашия бизнес
Практически стъпки, инструменти и работни процеси за ефективно интегриране на изкуствен интелект.

🔗 Как да стартирате компания за изкуствен интелект
От идеята до стартирането: валидиране, финансиране, екип и изпълнение.


Как работи изкуственият интелект? Отговорът за една минута ⏱️

Изкуственият интелект учи модели от данни, за да прави прогнози или да генерира съдържание - не са необходими ръчно написани правила. Системата приема примери, измерва колко греши чрез функция на загуба и настройва вътрешните си копчета - параметри - така че да бъдат малко по-малко грешни всеки път. Изплакнете, повторете, подобрете. С достатъчно цикли става полезно. Същата история, независимо дали класифицирате имейли, откривате тумори, играете настолни игри или пишете хайку. За разбираема основа в „машинното обучение“, общият преглед на IBM е солиден [1].

Повечето съвременният изкуствен интелект е машинно обучение. Най-простата версия: въвеждане на данни, изучаване на съответствие от входовете към изходите и след това обобщаване за нови неща. Не магическа математика, изчисления и, ако трябва да сме честни, щипка изкуство.


„Как работи изкуственият интелект?“ ✅

Когато хората търсят в Google „ Как работи изкуственият интелект?“ , те обикновено искат:

  • многократно използваем ментален модел, на който могат да се доверят

  • карта на основните видове обучение, така че жаргонът да спре да бъде страшен

  • поглед към невронните мрежи, без да се изгубите

  • защо трансформаторите сякаш управляват света сега

  • практическият процес от данните до внедряването

  • бърза сравнителна таблица, която можете да направите на екрана си и да запазите

  • предпазни мерки по отношение на етиката, пристрастията и надеждността, които не са неконкретни

Това ще получите тук. Ако се скитам, е нарочно - все едно поемам по живописния маршрут и някак си запомням улиците по-добре следващия път. 🗺️


Основните съставки на повечето системи с изкуствен интелект 🧪

Представете си система с изкуствен интелект като кухня. Четири съставки се появяват отново и отново:

  1. Данни — примери със или без етикети.

  2. Модел — математическа функция с регулируеми параметри.

  3. Цел — функция на загубата, измерваща колко лоши са предположенията.

  4. Оптимизация — алгоритъм, който променя параметрите, за да намали загубите.

В дълбокото обучение, това побутване обикновено е градиентен спуск с обратно разпространение - ефикасен начин да се разбере кое копче на гигантска резонаторна дъска е скърцало, след което да се намали малко [2].

Мини-казус: Заменихме крехък спам филтър, базиран на правила, с малък контролиран модел. След седмица цикли на етикетиране → измерване → актуализиране, фалшивите положителни резултати и заявките за поддръжка намаляха. Нищо особено - само по-чисти цели (прецизност при „хакерски“ имейли) и по-добра оптимизация.


Парадигми на обучението с един поглед 🎓

  • Контролирано обучение.
    Предоставяте двойки вход-изход (снимки с етикети, имейли, маркирани като спам/не спам). Моделът учи вход → изход. Гръбнакът на много практически системи [1].

  • Самостоятелно обучение.
    Без етикети. Намерете структурни клъстери, компресии, латентни фактори. Чудесно за проучване или предварително обучение.

  • Самостоятелно обучение.
    Моделът създава свои собствени етикети (предсказва следващата дума, липсващото изображение). Превръща суровите данни в обучителен сигнал в голям мащаб; е в основата на съвременни езикови и визуални модели.

  • Обучение с подкрепление
    Агентът действа, събира награди и научава политика, която максимизира кумулативната награда. Ако „функциите на стойността“, „политиките“ и „обучението с времеви разлики“ ви звучат познато – това е техният дом [5].

Да, категориите се размиват на практика. Хибридните методи са нормални. Реалният живот е хаотичен; доброто инженерство го среща там, където е.


Вътре в невронна мрежа без главоболие 🧠

Невронната мрежа подрежда слоеве от малки математически единици (неврони). Всеки слой трансформира входните данни с тегла, отклонения и мека нелинейност, подобна на ReLU или GELU. Ранните слоеве изучават прости функции; по-дълбоките кодират абстракции. „Магията“ – ако можем да я наречем така – е композицията : свържете малки функции и можете да моделирате изключително сложни явления.

Тренировъчен цикъл, само вибрации:

  • предположение → измерване на грешка → приписване на вина чрез обратно прехвърляне → тежести на побутване → повторение.

Правете това на партиди и, подобно на тромав танцьор, подобряващ всяка песен, моделът ще спре да ви стъпва на пръстите. За приятелска и строга глава за обратното пропиране вижте [2].


Защо трансформаторите превзеха властта - и какво всъщност означава „внимание“ 🧲

Трансформаторите използват самовнимание , за да преценят кои части от входния сигнал са важни една за друга, едновременно. Вместо да чете изречение строго отляво надясно, както при по-старите модели, трансформаторът може да гледа навсякъде и да оценява динамично взаимоотношенията – като сканиране на претъпкана стая, за да види кой с кого говори.

Този дизайн премахна рекурентността и конволюциите за моделиране на последователности, което позволи масивен паралелизъм и отлично мащабиране. Статията, която даде началото - „ Вниманието е всичко, от което се нуждаете“ - описва архитектурата и резултатите [3].

Самостоятелно внимание в един ред: създайте на заявка , ключ и стойност за всеки токен; изчислете прилики, за да получите тегла на вниманието; смесете стойностите съответно. Претенциозно в детайлите, елегантно в духа.

Внимание: Трансформаторите доминират, а не монополизират. CNN, RNN и дървовидните ансамбли все още печелят при определени типове данни и ограничения за латентност/цена. Изберете архитектурата за работата, а не рекламата.


Как работи изкуственият интелект? Практическият процес, който реално ще използвате 🛠️

  1. Формулиране на проблема.
    Какво предвиждате или генерирате и как ще се измерва успехът?

  2. на данни
    , етикетиране, ако е необходимо, почистване и разделяне. Очаквайте липсващи стойности и гранични случаи.

  3. Моделиране
    Започнете с простото. Базовите линии (логистична регресия, градиентно усилване или малък трансформатор) често превъзхождат героичната сложност.

  4. Обучение
    Изберете цел, изберете оптимизатор, задайте хиперпараметри. Итерирайте.

  5. Оценка.
    Използвайте резерви, кръстосана валидация и показатели, свързани с вашата реална цел (точност, F1, AUROC, BLEU, объркване, латентност).

  6. Разгръщане.
    Обслужване зад API или вграждане в приложение. Проследяване на латентност, цена, пропускателна способност.

  7. Мониторинг и управление
    Наблюдавайте отклонение, справедливост, надеждност и сигурност. Рамката за управление на риска за изкуствен интелект на NIST (GOVERN, MAP, MEASURE, MANAGE) е практичен контролен списък за надеждни системи от край до край [4].

Мини-случай: Модел на зрение се справи отлично в лабораторията, след което се обърка на терен при промяна на осветлението. Мониторинг на забелязано отклонение във входните хистограми; бързо увеличение + фина настройка възстановиха производителността. Скучно? Да. Ефективно? Също да.


Сравнителна таблица - подходи, за кого са предназначени, приблизителна цена, защо работят 📊

Несъвършено нарочно: малко неравномерното формулиране му помага да се усеща човешко.

Подход Идеална аудитория Ценово Защо работи / бележки
Контролирано обучение Анализатори, продуктови екипи ниско-средно Директно картографиране на вход → етикет. Чудесно, когато съществуват етикети; формира гръбнака на много внедрени системи [1].
Без надзор Изследователи на данни, научноизследователска и развойна дейност ниско Намира клъстери/компресии/латентни фактори - подходящи за откриване и предварително обучение.
Самостоятелно контролирано Екипи на платформата среден Създава свои собствени етикети от сурови данни-скали с изчисления и данни.
Обучение с подсилване Роботика, оперативни изследвания средно-високо Усвоява правила от сигнали за възнаграждение; прочетете Сътън и Барто за канона [5].
Трансформатори НЛП, визия, мултимодален средно-високо Самовниманието улавя дългосрочни дълбочини и се успорежда добре; вижте оригиналната статия [3].
Класическо машинно обучение (дървета) Таблични бизнес приложения ниско Евтини, бързи, често шокиращо силни базови линии върху структурирани данни.
Базирано на правила/символично Съответствие, детерминистично много ниско Прозрачна логика; полезна в хибриди, когато е необходима одитируемост.
Оценка и риск Всеки варира Използвайте метода GOVERN-MAP-MEASURE-MANAGE на NIST, за да го поддържате безопасен и полезен [4].

Ценообразуване = етикетиране на данни + изчисления + хора + обслужване.


Дълбоко гмуркане 1 - функции на загуба, градиенти и малките стъпки, които променят всичко 📉

Представете си, че нанасяте линия, за да предскажете цената на къщата въз основа на размера ѝ. Избирате параметри (w) и (b), прогнозирате (\hat{y} = wx + b) и измервате грешката със средноквадратична загуба. Градиентът ви казва в коя посока да се движите (w) и (b), за да намалите загубата най-бързо - като да вървите надолу по склона в мъгла, като усещате накъде е наклонен теренът. Актуализирайте след всяка партида и вашата линия се приближава до реалността.

В дълбоките мрежи това е същата песен с по-голяма лента. Backprop изчислява как параметрите на всеки слой са повлияли на крайната грешка - ефективно - така че можете да насочите милиони (или милиарди) копчета в правилната посока [2].

Ключови интуиции:

  • Загубата оформя пейзажа.

  • Градиентите са вашият компас.

  • Скоростта на учене е като размер на стъпката - твърде голяма и се клатушкаш, твърде малка и дремваш.

  • Регуляризацията ви предпазва от запомняне на тренировъчния набор като папагал с перфектно припомняне, но без разбиране.


Дълбоко гмуркане 2 - вграждане, подканване и извличане 🧭

Вгражданията картографират думи, изображения или елементи във векторни пространства, където подобни неща се разполагат близо едно до друго. Това ви позволява:

  • намерете семантично сходни пасажи

  • търсене на енергия, което разбира смисъла

  • включете генериране на данни с добавено търсене (RAG), така че езиковият модел да може да търси факти, преди да запише

Подсказките са начинът, по който управлявате генеративните модели - описвате задачата, давате примери, задавате ограничения. Мислете за това като за писане на много подробна спецификация за много бърз стажант: нетърпелив, понякога прекалено самоуверен.

Практически съвет: ако вашият модел халюцинира, добавете извличане на информация, затегнете подканата или оценете с обосновани показатели вместо с „вибрации“.


Дълбоко гмуркане 3 - оценка без илюзии 🧪

Добрата оценка изглежда скучна - точно това е смисълът.

  • Използвайте заключен тестов набор.

  • Изберете показател, който отразява болката на потребителя.

  • Направете аблации, за да знаете какво всъщност е помогнало.

  • Записвайте грешки с реални, но хаотични примери.

В производствения процес мониторингът е оценка, която никога не спира. Случват се отклонения. Появява се нов жаргон, сензорите се прекалибрират и вчерашният модел се променя леко. Рамката на NIST е практическа справка за текущо управление на риска и управление, а не политически документ, който да се отложи [4].


Бележка относно етиката, пристрастията и надеждността ⚖️

Системите с изкуствен интелект отразяват данните и контекста на внедряване. Това носи рискове: пристрастия, неравномерни грешки между групите, крехкост при промяна на разпределението. Етичната употреба не е по избор - това са залози. NIST посочва конкретни практики: документиране на рисковете и въздействията, измерване на вредни пристрастия, изграждане на резервни варианти и информиране на хората, когато залозите са високи [4].

Конкретни движения, които помагат:

  • събиране на разнообразни, представителни данни

  • измерване на представянето в различните подгрупи

  • карти с модели на документи и информационни листове

  • добавете човешки надзор, когато залозите са високи

  • проектиране на предпазни механизми, когато системата е несигурна


Как работи изкуственият интелект? Като ментален модел можете да го използвате повторно 🧩

Компактен контролен списък, който можете да приложите към почти всяка система с изкуствен интелект:

  • Каква е целта? Прогнозиране, класиране, генериране, контрол?

  • Откъде идва сигналът за обучение? Етикети, задачи със самостоятелно управление, награди?

  • Каква архитектура се използва? Линеен модел, дървовиден ансамбъл, CNN, RNN, трансформатор [3]?

  • Как е оптимизирано? Вариации на градиентно спускане/обратно движение [2]?

  • Какъв режим на данни? Малък етикетиран набор, океан от немаркиран текст, симулирана среда?

  • Какви са режимите на отказ и предпазните мерки? Отклонение, дрейф, халюцинации, латентност, картографиране на разходите съгласно GOVERN-MAP-MEASURE-MANAGE на NIST [4].

Ако можете да отговорите на тези въпроси, значи основно разбирате системата - останалото са детайли от внедряването и познания за областта.


Бързи източници, които си струва да добавите в отметките си 🔖

  • Въведение на разбираем език в концепциите на машинното обучение (IBM) [1]

  • Обратно разпространение с диаграми и лека математика [2]

  • Трансформаторната статия, която промени моделирането на последователности [3]

  • Рамка за управление на риска, свързан с изкуствения интелект, на NIST (практическо управление) [4]

  • Учебникът за канонично обучение с подсилване (безплатен) [5]


ЧЗВ светкавичен кръг ⚡

Изкуственият интелект само статистика ли е?
Това е статистика плюс оптимизация, изчисления, инженерство на данни и продуктов дизайн. Статистиката е скелетът; останалото е мускулът.

По-големите модели винаги ли печелят?
Мащабирането помага, но качеството на данните, оценката и ограниченията за внедряване често са по-важни. Най-малкият модел, който постига целта ви, обикновено е най-подходящ за потребителите и портфейлите.

Може ли изкуственият интелект да разбира?
Дефинирайте „разбиране“ . Моделите улавят структурата в данните и обобщават впечатляващо; но те имат слепи петна и могат уверено да грешат. Отнасяйте се към тях като към мощни инструменти, а не като към мъдреци.

Вечна ли е ерата на трансформаторите?
Вероятно не завинаги. Сега тя е доминираща, защото вниманието се паралелизира и мащабира добре, както показа оригиналната статия [3]. Но изследванията продължават.


Как работи изкуственият интелект? Твърде дълго, не прочетох 🧵

  • Изкуственият интелект учи модели от данни, минимизира загубите и ги обобщава към нови входни данни [1,2].

  • Основните методи за обучение са контролирано, неконтролирано, самоконтролирано и обучение с подсилване; RL се учи от награди [5].

  • Невронните мрежи използват обратно разпространение и градиентен спуск, за да настройват ефективно милиони параметри [2].

  • Трансформаторите доминират в много последователни задачи, защото самовниманието улавя взаимоотношенията паралелно в голям мащаб [3].

  • Изкуственият интелект в реалния свят е процес на изграждане – от формулирането на проблема през внедряването и управлението – а рамката на NIST ви държи честни относно риска [4].

Ако някой попита отново „ Как работи изкуственият интелект?“ , можете да се усмихнете, да отпиете от кафето си и да кажете: той се учи от данни, оптимизира загуба и използва архитектури като трансформатори или дървовидни ансамбли в зависимост от проблема. След това добавете намигване, защото това е едновременно просто и скришом завършено. 😉


Референции

[1] IBM - Какво е машинно обучение?
прочетете повече

[2] Майкъл Нилсен - Как работи алгоритъмът за обратно разпространение
прочетете повече

[3] Васвани и др. - Вниманието е всичко, от което се нуждаете (arXiv)
прочетете повече

[4] NIST - Рамка за управление на риска, свързан с изкуствения интелект (AI RMF 1.0)
прочетете повече

[5] Сътън и Барто - Обучение с подсилване: Въведение (2-ро издание)
прочетете повече

Намерете най-новия изкуствен интелект в официалния магазин за асистенти с изкуствен интелект

За нас

Обратно към блога