Изкуственият интелект се появява навсякъде - на телефона ви, във входящата ви поща, променяйки карти, пишейки имейли, които почти сте възнамерявали да напишете. Но какво е изкуствен интелект ? Накратко: това е съвкупност от техники, които позволяват на компютрите да изпълняват задачи, които свързваме с човешкия интелект, като разпознаване на модели, правене на прогнози и генериране на език или изображения. Това не е маркетинг, базиран на ръчни изчисления. Това е здраво стъпила област с математика, данни и много опити и грешки. Авторитетните референции представят изкуствения интелект като системи, които могат да учат, да разсъждават и да действат за постигане на цели по начини, които ние намираме за интелигентни. [1]
Статии, които може да ви харесат след тази:
🔗 Какво е изкуствен интелект с отворен код?
Разберете изкуствения интелект с отворен код, предимствата, моделите на лицензиране и сътрудничеството в общността.
🔗 Какво е невронна мрежа в изкуствения интелект?
Научете основите на невронните мрежи, видовете архитектура, обучението и често срещаните им приложения.
🔗 Какво е компютърно зрение в изкуствения интелект?
Вижте как машините интерпретират изображения, ключови задачи, набори от данни и приложения.
🔗 Какво е символичен ИИ?
Разгледайте символичното мислене, графите на знанието, правилата и хибридните невро-символни системи.
Какво е ИИ: бързата версия 🧠➡️💻
Изкуственият интелект е набор от методи, които позволяват на софтуера да апроксимира интелигентно поведение. Вместо да кодираме всяко правило, ние често обучаваме модели върху примери, така че те да могат да се обобщават за нови ситуации - разпознаване на изображения, преобразуване на реч в текст, планиране на маршрути, асистенти за код, прогнозиране на протеинова структура и т.н. Ако харесвате спретнато определение за вашите бележки: представете си компютърни системи, изпълняващи задачи, свързани с човешки интелектуални процеси, като например разсъждение, откриване на смисъл и учене от данни. [1]
Полезен ментален модел от тази област е да се третира ИИ като целенасочени системи , които възприемат средата си и избират действия - полезно, когато започнете да мислите за цикли на оценка и управление. [1]
Какво прави изкуствения интелект наистина полезен✅
Защо да се посяга към изкуствен интелект вместо към традиционните правила?
-
Мощност на моделите - моделите забелязват фини корелации между огромни набори от данни, които хората биха пропуснали преди обяд.
-
Адаптация - с повече данни, производителността може да се подобри, без да се налага пренаписване на целия код.
-
Скорост в голям мащаб - веднъж обучени, моделите работят бързо и последователно, дори при стресови обеми.
-
Генеративност - съвременните системи могат да произвеждат текст, изображения, код, дори кандидат-молекули, не само да класифицират неща.
-
Вероятностно мислене - те се справят с несигурността по-грациозно от крехките „ако-иначе“ гори.
-
Инструменти, използващи инструменти - можете да свържете модели към калкулатори, бази данни или търсене, за да увеличите надеждността.
-
Когато не е добре - пристрастия, халюцинации, остарели данни за обучение, рискове за поверителност. Ще стигнем до там.
Нека бъдем честни: понякога изкуственият интелект се усеща като велосипед за ума, а понякога като едноколесно колело по чакъл. И двете могат да бъдат верни.
Как работи изкуственият интелект, с човешка скорост 🔧
Повечето съвременни системи с изкуствен интелект комбинират:
-
Данни - примери за език, изображения, кликвания, показания на сензори.
-
Цели - функция на загуба, която казва как изглежда „доброто“.
-
Алгоритми - процедурата за обучение, която насочва модела към минимизиране на тази загуба.
-
Оценка - тестови набори, показатели, проверки за надеждност.
-
Разгръщане - обслужване на модела с мониторинг, безопасност и предпазни огради.
Две широки традиции:
-
Символичен или логически базиран ИИ - явни правила, графи на знания, търсене. Чудесен за формални разсъждения и ограничения.
-
Статистически или базиран на обучение изкуствен интелект - модели, които се учат от данни. Именно тук живее дълбокото обучение и откъдето идва по-голямата част от скорошния шум; широко цитиран преглед картографира територията от многопластови представяния до оптимизация и обобщение. [2]
В рамките на изкуствения интелект, базиран на обучение, няколко основни стълба са важни:
-
Контролирано обучение - учете се от обозначени примери.
-
Неконтролирано и самоконтролирано - изучаване на структура от немаркирани данни.
-
Обучение с подсилване - учене чрез опит и обратна връзка.
-
Генеративно моделиране - научете се да създавате нови образци, които изглеждат реални.
Две генеративни семейства, за които ще чувате ежедневно:
-
Трансформърс - архитектурата зад повечето големи езикови модели. Тя използва внимание , за да свърже всеки токен с другите, което позволява паралелно обучение и изненадващо плавни резултати. Ако сте чували за „самостоятелно внимание“, това е основният трик. [3]
-
Дифузионни модели - те се учат да обръщат процеса на шумене, преминавайки от случаен шум обратно към отчетливо изображение или звук. Това е като разбъркване на тесте карти, бавно и внимателно, но с помощта на математически анализ; фундаменталната работа показа как да се обучава и семплира ефективно. [5]
Ако метафорите ви се струват преувеличени, това е справедливо - изкуственият интелект е движеща се мишена. Всички ние учим танца, докато музиката се променя по средата на песента.
Където вече срещате ИИ всеки ден 📱🗺️📧
-
Търсене и препоръки - резултати от класиране, емисии, видеоклипове.
-
Имейл и документи - автоматично довършване, обобщаване, проверки на качеството.
-
Камера и аудио - шумопотискане, HDR, транскрипция.
-
Навигация - прогнозиране на трафика, планиране на маршрут.
-
Поддръжка и обслужване - чат агенти, които сортират съобщенията и изготвят отговори.
-
Кодиране - предложения, рефакториране, тестове.
-
Здравеопазване и наука - триаж, образна диагностика, прогнозиране на структури. (Третирайте клиничните контексти като критични за безопасността; използвайте човешки надзор и документирани ограничения.) [2]
Мини анекдот: продуктов екип може да A/B тества стъпка за извличане на данни пред езиков модел; процентите на грешки често намаляват, защото моделът разсъждава върху по-нов, специфичен за задачата контекст, вместо да гадае. (Метод: дефинирайте показатели предварително, запазете набор от резервни опции и сравнявайте подобни подкани.)
Силни страни, ограничения и лекият хаос между тях ⚖️
Силни страни
-
Справя се с големи, разхвърляни набори от данни с грация.
-
Мащабира се в различни задачи със същите основни машини.
-
Научава латентна структура, която не сме създали ръчно. [2]
Лимити
-
Халюцинации - моделите могат да генерират правдоподобни, но неправилни резултати.
-
Пристрастия - данните от обучението могат да кодират социални пристрастия, които системите след това възпроизвеждат.
-
Устойчивост - граничните случаи, враждебните входове и промяната в разпределението могат да нарушат работата.
-
Поверителност и сигурност - чувствителни данни могат да изтекат, ако не внимавате.
-
Обяснимост - защо е казано това? Понякога е неясно, което осуетява одитите.
Управлението на риска съществува, за да не се създава хаос: рамката за управление на риска в областта на изкуствения интелект на NIST предоставя практически, доброволни насоки за подобряване на надеждността в процесите на проектиране, разработка и внедряване - помислете за картографиране на рисковете, измерването им и управлението на употребата от край до край. [4]
Правила за движение по пътищата: безопасност, управление и отчетност 🛡️
Регулирането и насоките настигат практиката:
-
Подходи, основани на риска - приложенията с по-висок риск са изправени пред по-строги изисквания; документацията, управлението на данните и обработката на инциденти са от значение. Публичните рамки наблягат на прозрачността, човешкия надзор и непрекъснатото наблюдение. [4]
-
Нюанси в сектора - критичните за безопасността области (като здравеопазването) изискват „човешко участие“ и внимателна оценка; инструментите с общо предназначение все още се възползват от ясна документация за предназначение и ограничения. [2]
Не става въпрос за задушаване на иновациите; става въпрос за това да не превърнете продукта си в машина за пуканки в библиотека... което звучи забавно, докато не спре да става.
Видове ИИ на практика, с примери 🧰
-
Възприятие - зрение, реч, сливане на сензори.
-
Език - чат, превод, обобщаване, извличане.
-
Прогнозиране - прогнозиране на търсенето, оценка на риска, откриване на аномалии.
-
Планиране и контрол - роботика, логистика.
-
Генериране - изображения, аудио, видео, код, структурирани данни.
Под капака, математиката се основава на линейна алгебра, вероятности, оптимизация и изчислителни стекове, които поддържат всичко в движение. За по-задълбочен поглед върху основите на дълбокото обучение вижте каноничния преглед. [2]
Сравнителна таблица: популярни инструменти за изкуствен интелект с един поглед 🧪
(Леко несъвършено нарочно. Цените се променят. Вашият пробег ще варира.)
| Инструмент | Най-добро за | Цена | Защо работи доста добре |
|---|---|---|---|
| LLM в стил чат | Писане, въпроси и отговори, генериране на идеи | Безплатно + платено | Силно езиково моделиране; инструменти за запознаване с инструменти |
| Генератори на изображения | Дизайн, мудбордове | Безплатно + платено | Дифузионните модели блестят във визуализациите |
| Кодови втори пилоти | Разработчици | Платени пробни периоди | Обучен за работа с корпуси на код; бързи редакции |
| Търсене във векторна база данни | Продуктови екипи, поддръжка | Варира | Извлича факти, за да намали отклонението |
| Инструменти за реч | Срещи, творци | Безплатно + платено | ASR + TTS, което е шокиращо ясно |
| Аналитичен изкуствен интелект | Операции, финанси | Предприятие | Прогнозиране без 200 електронни таблици |
| Инструменти за безопасност | Съответствие, управление | Предприятие | Картиране на риска, регистриране, обединяване на хора в червени екипи |
| Малко на устройството | Мобилни устройства, хора с поверителност | Свободно | Ниска латентност; данните остават локални |
Как да оценим система с изкуствен интелект като професионалист 🧪🔍
-
Дефинирайте работата - едноизречение като задача.
-
Изберете показатели - точност, латентност, цена, фактори за безопасност.
-
Направете тестов набор - представителен, разнообразен, издържан.
-
Проверете режимите на отказ - входните данни, които системата трябва да отхвърли или ескалира.
-
Тест за отклонения - демографски срезове и чувствителни атрибути, където е приложимо.
-
Човек в цикъла - посочете кога дадено лице трябва да прегледа.
-
Регистриране и наблюдение - откриване на дрейф, реагиране на инциденти, връщане към предишни промени.
-
Документ - източници на данни, ограничения, предназначение, предупредителни знаци. NIST AI RMF ви предоставя споделен език и процеси за това. [4]
Често срещани погрешни схващания, които чувам постоянно 🙃
-
„Това е просто копиране.“ Обучението учи статистическа структура; генерирането съставя нови резултати, съответстващи на тази структура. Това може да бъде изобретателно - или погрешно - но не е копиране и поставяне. [2]
-
„Изкуственият интелект разбира като човек.“ Той моделира модели. Понякога това изглежда като разбиране; понякога е самоуверено размазано. [2]
-
„По-голямото винаги е по-добре.“ Мащабът помага, но качеството на данните, подравняването и извличането често са по-важни. [2][3]
-
„Един ИИ, който да управлява всички.“ Истинските стекове са мултимоделни: извличане на факти, генеративно търсене на текст, малки бързи модели на устройството, плюс класическо търсене.
Малко по-задълбочен поглед: Трансформърс и дифузия, за една минута ⏱️
-
Трансформаторите изчисляват оценките за внимание между токените, за да решат върху какво да се фокусират. Наслагването на слоеве улавя дългосрочни зависимости без изрично повторение, което позволява висок паралелизъм и висока производителност при езикови задачи. Тази архитектура е в основата на повечето съвременни езикови системи. [3]
-
Дифузионните модели се учат да премахват шума стъпка по стъпка, като полиране на замъглено огледало, докато се появи лице. Основните идеи за обучение и семплиране отключиха бума в генерирането на изображения и сега се простират до аудио и видео. [5]
Микро-речник, който можете да запазите 📚
-
Модел - параметризирана функция, която обучаваме, за да съпоставяме входовете с изходите.
-
Обучение - оптимизиране на параметрите за минимизиране на загубите при примери.
-
Преобучение - справя се чудесно с тренировъчните данни, другаде нищо.
-
Халюцинация - плавен, но фактически грешен изход.
-
RAG - поколение, допълнено с извличане на информация, което консултира нови източници.
-
Привеждане в съответствие - оформяне на поведението, за да се следват инструкции и норми.
-
Безопасност - предотвратяване на вредни последици и управление на риска през целия жизнен цикъл.
-
Извод - използване на обучен модел за правене на прогнози.
-
Латентност - време от въвеждането до отговора.
-
Предпазни парапети - правила, филтри и контроли около модела.
Твърде дълго, не го прочетох - Заключителни бележки 🌯
Какво е изкуствен интелект? Съвкупност от техники, които позволяват на компютрите да се учат от данни и да действат интелигентно за постигане на цели. Съвременната вълна се движи върху дълбокото обучение - особено трансформаторите за език и дифузията за медиите. Използван внимателно, изкуственият интелект мащабира разпознаването на модели, ускорява творческата и аналитичната работа и отваря нови научни врати. Използван небрежно, той може да подведе, изключи или подкопае доверието. Щастливият път съчетава силно инженерство с управление, измерване и нотка смирение. Този баланс не е просто възможен - той е преподаваем, тестваем и поддържаем с правилните рамки и правила. [2][3][4][5]
Референции
[1] Енциклопедия Британика - Изкуствен интелект (ИИ) : прочетете повече
[2] Природа - „Дълбоко обучение“ (ЛеКун, Бенджио, Хинтън) : прочетете повече
[3] arXiv - „Вниманието е всичко, от което се нуждаете“ (Васвани и др.) : прочетете повече
[4] NIST - Рамка за управление на риска, свързан с ИИ : прочетете повече
[5] arXiv - „Подтискане на шума чрез дифузионни вероятностни модели“ (Хо и др.) : прочетете повече