Какво е AI треньор?

Какво е AI треньор?

Понякога изкуственият интелект се усеща почти като магически трик. Въвеждате случаен въпрос и бам - за секунди се появява изчистен, изпипан отговор. Но ето го и кривата ситуация: зад всяка „гениална“ машина стоят реални хора, които я побутват, коригират и оформят по пътя. Тези хора се наричат ​​треньори на ИИ и работата, която вършат, е по-странна, по-забавна и честно казано по-човешка, отколкото повечето хора предполагат.

Нека разгледаме защо тези треньори са важни, как всъщност изглежда ежедневието им и защо тази роля се разраства по-бързо, отколкото някой е предвиждал.

Статии, които може да ви харесат след тази:

🔗 Какво е AI арбитраж: Истината зад модната дума
Обяснява арбитража с изкуствен интелект, неговите рискове, ползи и често срещани погрешни схващания.

🔗 Изисквания за съхранение на данни за изкуствен интелект: Какво наистина трябва да знаете
Обхваща нуждите от съхранение, мащабируемостта и ефективността на системите с изкуствен интелект.

🔗 Кой е бащата на изкуствения интелект?
Изследва пионерите на изкуствения интелект и произхода на него.


Какво прави един AI трейнер солиден? 🏆

Не е работа, при която човек трябва да натиска копчета. Най-добрите треньори се основават на доста странна комбинация от таланти:

  • Търпение (много) - Моделите не се учат отведнъж. Треньорите продължават да повтарят едни и същи корекции, докато не се запомнят.

  • Забелязване на нюанси - Улавянето на сарказъм, културен контекст или пристрастия е това, което дава предимство на човешката обратна връзка [1].

  • Директна комуникация - Половината работа е да се напишат ясни инструкции, които изкуственият интелект не може да разчете погрешно.

  • Любопитство + етика - Добрият обучител поставя под въпрос дали даден отговор е „фактически правилен“, но социално глух - основна тема в надзора върху ИИ [2].

Казано по-просто: един треньор е отчасти учител, отчасти редактор и малко етик.


Ролите на AI треньорите с един поглед (с някои особености 😉)

Тип роля Кой е най-подходящ Типично заплащане Защо работи (или не)
Етикетиране на данни Хора, които обичат фините детайли Ниско-средно $$ Абсолютно важно; ако етикетите са небрежни, целият модел страда [3] 📊
Специалист по RLHF Писатели, редактори, анализатори Средно-високо $$ Класира и пренаписва отговорите, за да приведе тона и яснотата в съответствие с човешките очаквания [1]
Треньор на домейни Адвокати, лекари, експерти Навсякъде по картата 💼 Справя се с нишов жаргон и периферни случаи за специфични за индустрията системи
Рецензент по безопасността Хора с етично мислене Среден $$ Прилага насоки, така че изкуственият интелект да избягва вредно съдържание [2][5]
Креативен треньор Художници, разказвачи Непредсказуемо 💡 Помага на ИИ да отразява въображението, като същевременно остава в безопасни граници [5]

(Да, форматирането е малко объркано - подобно на самата работа.)


Един ден от живота на треньор по изкуствен интелект

И така, как изглежда самата работа? Мислете за по-малко бляскаво кодиране и повече:

  • Класиране на отговорите, написани с изкуствен интелект, от най-лошия към най-добрия (класическа стъпка на RLHF) [1].

  • Поправяне на обърквания (например, когато моделът забрави, че Венера не е Марс).

  • Пренаписване на отговорите на чатботове, така че да звучат по-естествено.

  • Етикетиране на планини от текст, изображения или аудио - където точността наистина е важна [3].

  • Дебат дали „технически правилно“ е достатъчно или дали указанията за безопасност трябва да имат предимство [2].

Това е отчасти игра, отчасти пъзел. Честно казано, представете си да научите папагал не само да говори, но и да спре да използва думи леко неправилно - това е атмосферата. 🦜


Защо маратонките са много по-важни, отколкото си мислите

Без човешко управление, изкуственият интелект би:

  • Звучи скован и роботизиран.

  • Разпространение на пристрастия безконтролно (плашеща мисъл).

  • Пълно липсва хумор или емпатия.

  • Бъдете по-малко предпазливи в чувствителни контексти.

Треньорите са тези, които промъкват „разхвърляните човешки неща“ - жаргон, топлина, от време на време тромава метафора - като същевременно поставят предпазни огради, за да предпазят нещата [2][5].


Умения, които наистина имат значение

Забравете мита, че ви е необходима докторска степен. Това, което помага най-много, е:

  • Писане + редактиране - Изпипан, но естествено звучащ текст [1].

  • Аналитично мислене - Забелязване на повтарящи се грешки в модела и тяхното коригиране.

  • Културна осведоменост - Да се ​​знае кога фразировката може да е грешна [2].

  • Търпение - Защото изкуственият интелект не схваща веднага.

Бонус точки за многоезични умения или нишова експертиза.


Къде се появяват треньорите 🌍

Тази работа не е само за чатботове - тя се промъква във всеки сектор:

  • Здравеопазване - Правила за писане на анотации за гранични случаи (отразени в насоките за здравен изкуствен интелект) [2].

  • Финанси - Обучение на системи за откриване на измами, без да се удавят хора в фалшиви аларми [2].

  • Търговия на дребно - Обучение на асистенти как да усвояват жаргонния език на купувачите, като същевременно се придържат към тона на марката [5].

  • Образование - Оформяне на ботовете за обучение, така че да бъдат насърчаващи, вместо покровителствени [5].

По принцип: ако изкуственият интелект има място на масата, на заден план се крие треньор.


Етичната част (не мога да я пропусна)

Ето къде става важно. Ако не се контролира, изкуственият интелект повтаря стереотипи, дезинформация или нещо по-лошо. Обучителите спират това, като използват методи като RLHF или конституционни правила, които насочват моделите към полезни, безобидни отговори [1][5].

Пример: ако бот предложи предубедени препоръки за работа, обучител го маркира, пренаписва правилата и се уверява, че това няма да се случи отново. Това е надзор в действие [2].


Не толкова забавната страна

Не всичко е лъскаво. Треньорите се занимават с:

  • Монотонност - Безкрайното етикетиране остарява.

  • Емоционална умора - Преглеждането на вредно или обезпокоително съдържание може да окаже влияние; системите за подкрепа са от решаващо значение [4].

  • Липса на разпознаваемост - Потребителите рядко осъзнават, че треньорите съществуват.

  • Постоянна промяна - Инструментите се развиват непрекъснато, което означава, че обучителите трябва да са в крак с времето.

И все пак, за мнозина тръпката от оформянето на „мозъците“ на технологиите ги държи привързани.


Скритите MVP-та на ИИ

И така, кои са обучителите на ИИ? Те са мостът между суровите алгоритми и системите, които действително работят за хората. Без тях ИИ би бил като библиотека без библиотекари - тонове информация, но почти невъзможна за използване.

Следващия път, когато чатбот ви разсмее или ви накара да се почувствате изненадващо „в хармония“, благодарете на обучител. Те са тихите фигури, които карат машините не само да изчисляват, но и да се свързват [1][2][5].


Референции

[1] Оуянг, Л. и др. (2022). Обучение на езикови модели за следване на инструкции с човешка обратна връзка (InstructGPT). NeurIPS. Връзка

[2] NIST (2023). Рамка за управление на риска, свързан с изкуствения интелект (AI RMF 1.0). Връзка

[3] Норткут, К. и др. (2021). Широко разпространените грешки в етикетите в тестовите набори дестабилизират показателите за машинно обучение. NeurIPS набори от данни и показатели. Връзка

[4] СЗО/МОТ (2022). Насоки за психично здраве на работното място. Връзка

[5] Бай, Й. и др. (2022). Конституционен ИИ: Безвредност от обратната връзка от ИИ. arXiv. Връзка


Намерете най-новия изкуствен интелект в официалния магазин за асистенти с изкуствен интелект

За нас

Обратно към блога