Нас не волнует то, чего мы не знаем. LLM тоже На фотографии - McArthur Wheeler, который в 1995 году ограбил два банка. Он это делал даже без маски, т.к. вымазал лицо в лимонном соке и был уверен, что это сделает его невидимым для камер. Логика? С помощью лимонного сока можно писать невидимый текст на бумаге, значит и человека это тоже сделает невидимым. __Два исследователя так впечатлились этим примером, что провели исследование. Их звали Джастин Крюгер и Дэвид Даннинг, а синдром назвали __Эффектом Даннинга — Крюгера: Нас не волнует то, чего мы не знаем. Если бы это было не так, то люди бы до сих пор сидели на деревьях и боялись спуститься на землю. А вдруг съедят? Но для эволюции имеют значение не те миллионы, которых ожидаемо слопали, а те единицы, которым повезло выжить и оставить потомство. Какое отношение это имеет к LLM? LLM - это модели, которые заточены на то, чтобы выдавать наиболее приятные для человека ответы. По смыслу там средняя температура по больнице, главное не вглядываться в детали. LLM при генерации ответа не волнует, можем ли мы проверить их ответы на ошибки. Языковые модели просто делают свою работу и генерируют правдоподобное полотно текста. Скажем, новая Llama 4 делала это так приятно, что на LLM Арене заняла второе место после выхода. Правда потом выяснилось, что это просто был тюн под человеческие предпочтения (что говорит многое и про этот релиз Llama 4, и про бенчмарк в целом, и про поведение людей). В общем, какие выводы? (1) LLM способны усиливать как человеческий ум, так и человеческую глупость. Второе проще - достаточно выдать ответ в той области, где читающие не являются экспертами. А они и не заметят! (2) Современные MCP/A2A, как LangChain на стероидах, упрощают интеграцию всевозможных систем c LLM. Поэтому ереси будет встречаться много. А потом срабатывает принцип Альберто Брандолини: __The amount of energy needed to refute bullshit is an order of magnitude bigger than that needed to produce it.__ (3) Если в продукте с LLM под капотом не упоминается слово Accuracy в контексте цифр и доказательств, то это умножитель Даннинга — Крюгера. Бегите. (4) Хотите, чтобы ответ LLM нравился людям? Попросите отвечать как позитивный подросток с кучей emoji. Ваш, @llm_under_hood 🤗
Нас не волнует то, чего мы не знаем. LLM тоже На фотографии - McArthur Wheeler,…
Из этого канала
- #556"7 выводов о внедрении AI в бизнес на примерах крупных компаний TLDR; начинаем…
"7 выводов о внедрении AI в бизнес на примерах крупных компаний TLDR; начинаем со сбора evals Если кто знает больше всего про то, как внедрять OpenAI в бизнес,…
- #557Вот это 20 минутное видео я разослал всем командам, которые я курирую в области…
Вот это 20 минутное видео я разослал всем командам, которые я курирую в области внедрения AI в бизнес, чтобы они обязательно его посмотрели.
- #559Как системно внедрять LLM в бизнес без галлюцинаций? Для engineering leads. Что…
Как системно внедрять LLM в бизнес без галлюцинаций? Для engineering leads. Что делать компании среднего размера, которая попробовала решить несколько проблем…
- #554Cекретная Quasar Alpha модель довольно неплоха. Погадаем, кто это? У модели 8…
Cекретная Quasar Alpha модель довольно неплоха. Погадаем, кто это? У модели 8 место в моем бенчмарке на текущий момент.
- #553Google: Agent2Agent Protocol (A2A) Google захотела сделать свой MCP протокол,…
Google: Agent2Agent Protocol (A2A) Google захотела сделать свой MCP протокол, только с крупными компаниями. Готово. Назвали его A2A (Agent2Agent).