Помню где-то услышал шутку: — Так у меня доступ ко всему интернету есть, все сайты. — В смысле ты имеешь в виду все сайты до которых дотянулся Google? Мораль была в том, что нет какого-то единого списка сайтов (а раньше были! когда интернет крохотный был), нельзя посмотреть всё в сети. Вы получаете доступ в интернет по большей части через поисковик (даже если какой-то сайт вам посоветовали знакомые — откуда они узнали? а их друзья?) и сохранённые ссылки и сайты. В ноябре '25 CEO Cloudflare (это которые постоянно ложатся, а у вас потом интернет не открывается) загадал загадку: насколько больше веб-страниц видит Googlebot по сравнению с GPTBot (OpenAI), Bingbot (Microsoft) и Claudebot (Anthropic)? Мне было очень интересно, и вот я наткнулся на ответ: На каждую страницу, которую видит бот OpenAI, Google видит 3.2 страницы. Этот коэффициент равен 4.8 для Microsoft и Anthropic, а остальные идут в списке ещё ниже. То есть даже несмотря на невероятную работу, проделанную инженерами OpenAI, они всё равно имеют доступ к примерно в 3 раза меньшему количеству веб-страниц. Сложно сказать, насколько это критично — в хвосте этого распределения данные могут быть не самые качественные или вообще ненужные; плюс на этих страницах может быть банально меньше информации, и меньше её плотносить.
Помню где-то услышал шутку: — Так у меня доступ ко всему интернету есть, все…
Из этого канала
- #3294Скоро начнётся выкатка SLS на LC-39B. Ворота высотного цеха VAB уже подняты.…
Скоро начнётся выкатка SLS на LC-39B. Ворота высотного цеха VAB уже подняты. Чувствуете, как начинает подбираться это ощущение, что скоро 4 человека полетит к…
- #3298The Information: TSMC не может производить ИИ-чипы слишком быстро – Nvidia и…
The Information: TSMC не может производить ИИ-чипы слишком быстро – Nvidia и Broadcom просят TSMC предоставить доп.
- #3299Надеюсь, они смогут объяснить акционерам, почему выручка растёт всего лишь на…
Надеюсь, они смогут объяснить акционерам, почему выручка растёт всего лишь на 200%, а не на 500-600% 🙂
- #3292Продолжается судебная сага OpenAI v Musk. В рамках процедуры раскрытия…
Продолжается судебная сага OpenAI v Musk. В рамках процедуры раскрытия документов юристы со стороны Elon Musk получили доступ к внутренним перепискам и даже…
- #3291Помните я буквально два дня назад писал про результаты конкурса предсказаний по…
Помните я буквально два дня назад писал про результаты конкурса предсказаний по АИ на 2025-й? Авторы запустили опрос на 2026й (несмотря на то, что в твиттере…