https://www.techinsider.ru/news/news-1635093-ch...
7 мар. 2024 г. ... Токен — это последовательность текстовых символов. Когда LLM (большие языковые модели) делают свое дело, они разбивают текст не на слова, а на ...
https://habr.com/ru/articles/854664/
30 окт. 2024 г. ... В трансформере all-MiniLM-L6-v2 используется токенизатор Wordpiece, оперирующий подсловами. Символы ## означают, что токен — это подслово, ...
https://habr.com/ru/articles/875022/
20 янв. 2025 г. ... Эта статья про новое расширение ахритектуры трансформеров – Titan от Google –, позволяющее расширить рамки LLM до 2 млн токенов, побудила ...
https://vc.ru/ai/1813092-kak-rabotayut-llm-kak-...
17 февр. 2025 г. ... Проще всего представить токены как кусочки текста. Это могут быть: отдельные буквы (в редких случаях),; целые слова,; части слов (например, в ...
https://www.megaputer.ru/osvoenije-llm/
23 янв. 2024 г. ... Токен — небольшой, понятный для модели фрагмент текста: слово, слог или отдельный символ. Например, предложение «Мегапьютер лучше всех!» может ...
https://vc.ru/id3443211/1603577-kak-chelovek-i-...
22 окт. 2024 г. ... LLM, такие как GPT, основаны на концепции токенов. Токены — это базовые единицы текста, которые ИИ использует для обработки и генерации языка.
https://huggingface.co/learn/llm-course/ru/chap...
Наконец, нам нужен специальный токен для обозначения слов, которых нет в нашем словаре. Это так называемый “unknown” токен, часто представляемый как ”[UNK]” или ...
https://yandex.cloud/ru/docs/foundation-models/...
11 апр. 2025 г. ... Токены позволяют нейросетям находить закономерности и обрабатывать естественный язык ... llm.api.cloud.yandex.net/foundationModels/v1/tokenize".
https://learn.microsoft.com/ru-ru/azure/api-man...
Политика llm-token-limit предотвращает пики использования API больших языковых моделей (LLM) на основе каждого ключа путем ограничения потребления маркеров ...
https://blog.colobridge.net/2025/04/context-win...
30 апр. 2025 г. ... В среднем на 100 токенов приходится 75 слов, но в разных моделях число может отличаться. Вот как, например, выглядит разбивка на токены (или ...
Что такое ТОКЕНЫ в LLM. 2я серия. БАЗА - YouTube
www.youtube.com
Раскрывая секреты LLM: руководство по основным понятиям больших ...
habr.com
Эффективный запуск и инференс LLM на своем сервере с нуля (часть 1) / Хабр
habr.com
ChatGPT DeepSeek Copilot и другие LLM для Data Engineer - DataTalks.RU ...
datatalks.ru
Решаем проблему галлюцинаций LLM с помощью алгоритма фрактального ...
habr.com
Алгоритмы спекулятивного инференса LLM / Хабр
habr.com
Токен LLM. Публичная оферта - Montelibero
montelibero.org
Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий ...
habr.com
Раскрывая секреты LLM: руководство по основным понятиям больших ...
habr.com
YouTube • March 13, 2025 • 14:49
In this video, we explain tokenization in Large Language Models (LLMs) in a beautiful, visual manner. We cover the following: (1) Stages of building an LLM (2) Word based tokenization and it's disadvantages (3) Character based tokenization and it's disadvantages (4) Sub-word based tokenization (5) Byte Pair Encoding (BPE) and how it works ...
YouTube • August 1, 2024 • 13:42
Записывайтесь на курс по LLM: https://deepschool.ru/llm?utm_source=yt&utm_content=overslept-llm! Если вы проспали бум вокруг LLM и хотите разобраться, что сейчас в них происходит простыми словами, от инженера инженеру, мы ...
YouTube • January 19, 2025 • 14:19
Новости нейросетей и искусственного интеллекта за эту неделю! Много новостей и обновлений от OpenAI. Компания разработала новую модель GPT-4b micro для биологических исследований, а Sam Altman заявил о ...
YouTube • May 13, 2024 • 06:20
"🔥 Large Language Models (LLMs) Course with Generative AI : https://www.edureka.co/generative-ai-llms-course In this video on ""What is LLM"" we'll dive into large language models (LLMs), powerful AI systems trained on massive text datasets to understand and generate human-like language. We'll introduce the concept of LLMs, explain how they ...
YouTube • February 6, 2025 • 45:42
Приглашаем на конференцию Saint HighLoad++ 2025, которая пройдет 23 и 24 июня в Санкт-Петербурге! Программа, подробности и билеты по ссылке: https://highload.ru/spb/2025 ________ Крупнейшая профессиональная ...
YouTube • March 18, 2025 • 07:05
🔥Generative AI Course: Masters Program: https://www.edureka.co/masters-program/generative-ai-prompt-engineering-training 🔥Large Language Models (LLMs) Training Course: https://www.edureka.co/generative-ai-llms-course In this video, we’ll explore the key differences between *Large Language Models (LLMs) and Small Language Models (SLMs ...