Сооснователь Ethereum Виталик Бутерин положительно отозвался о новом проекте TiTok AI, специализирующемся на сжатии изображений, а также их ончейн-хранении.
По мнению программиста, инструмент обладает хорошими перспективами в плане применения в блокчейн-сфере. Он отметил, что сжатие такого рода файлов до 320 бит — это фактически хэш, который можно без проблем разместить ончейн.
Согласно white paper проекта, TiTok AI представляет собой инновационный подход, позволяющий токенизировать изображения в одномерные латентные последовательности. Этот метод получил название Transformer-based 1-Dimensional Tokenizer (TiTok), а за его разработку ответственны исследователи из Технического университета Мюнхена и компании ByteDance.
TiTok состоит из кодера Vision Transformer (ViT), декодера ViT и аналогичного классическим моделям векторного квантователя (VQ).
На этапе токенизации изображение делится на фрагменты, которые затем «сплющиваются» и объединяются в одномерную последовательность специальных токенов. После того как ViT-кодер обрабатывает информацию, полученные маркеры формируют латентное представление картинки.
Разработчики инструмента считают, что TiTok способен кардинально преобразовать процесс обработки изображений. При этом значительно расширяется роль ИИ-технологий и блокчейна, подчеркивают создатели проекта.
Эксперт из сферы ИИ-технологий под ником Ethan_smith_20 назвал новый инструмент «безумием». По его словам, проект установил новую планку в масштабах сжатия изображений при относительно высоком сохранении качества.
so this is nuts, if you're cool with the high frequncy details of an image being reinterpreted/stochastic, you can encode an image quite faithfully into 32 tokens…
with a codebook size of 1024 as they use this is just 320bits, new upper bound for the information in an image… pic.twitter.com/DSZcmlWQf0— Ethan (@Ethan_smith_20) June 14, 2024
Отметим, что инструмент не стоит путать с известным сервисом для создания и просмотра коротких видеороликов под названием TikTok.