Акции Nvidia снова достигли рекордных значений, а прогресс многомодальных моделей еще больше углубил технологический барьер Web2 AI. От семантической согласованности до визуального понимания, от высокоразмерных встраиваний до слияния признаков, сложные модели интегрируют различные способы выражения с беспрецедентной скоростью, создавая все более закрытую AI-высоту. Рынок акций США также подтвердил это на практике, как акции, связанные с криптовалютами, так и акции AI демонстрируют небольшую бычью тенденцию.
Однако этот бум, похоже, не имеет много общего с областью криптовалют. Недавние попытки в области Web3 AI, особенно исследования в направлении Agent, имеют значительные отклонения в направлении: попытка собрать многомодульную систему в стиле Web2 с использованием децентрализованной структуры на самом деле является двойным несоответствием как в технологии, так и в мышлении. В условиях высокой связности модулей, крайне нестабильного распределения признаков и постоянно растущих требований к вычислительной мощности, многомодульность в среде Web3 сталкивается с трудностями.
Будущее Web3 AI заключается не в простом подражании, а в стратегическом обходе. От семантического выравнивания в высокоразмерных пространствах до информационных узких мест в механизмах внимания и выравнивания признаков в условиях гетерогенной вычислительной мощности, Web3 AI необходимо применять тактическую стратегию "сельская осада города".
Web3 AI на основе плоской многомодальной модели, несоответствие семантики приводит к снижению производительности
В современных мультимодальных системах Web2 AI "семантическое выравнивание" позволяет отображать информацию из различных модальностей в одно и то же семантическое пространство, что позволяет моделям понимать и сопоставлять внутренние значения этих изначально различных сигналов. Высокоразмерное встраиваемое пространство является ключом к достижению этой цели.
Однако протокол Web3 Agent трудно реализовать с высоким размерным вложением. Большинство Web3 Agent просто упаковывают готовые API в отдельные "агенты", не имея единого центрального пространства вложения и кросс-модульного механизма внимания. Это приводит к тому, что информация не может взаимодействовать между модулями с разных углов и на разных уровнях, а работает только по линейному конвейеру, проявляя единственную функцию и не способствуя формированию общей замкнутой оптимизации.
Для реализации интеллектуального агента с барьерами для входа в отрасль необходимо преодолеть узкие места через совместное моделирование от начала до конца, унифицированное встраивание между модулями, а также систематическую инженерию совместного обучения и развертывания. Однако в настоящее время рынок не демонстрирует такой спрос.
В низкоразмерном пространстве механизм внимания нельзя точно спроектировать
Высокоэффективные многомодальные модели требуют тщательно спроектированных механизмов внимания. Механизм внимания по сути представляет собой способ динамического распределения вычислительных ресурсов, позволяя модели при обработке ввода одной модальности выборочно "сосредоточиваться" на наиболее релевантных частях.
Web2 AI при проектировании механизма внимания основывается на ключевой идее динамического распределения "весов внимания" для каждого элемента при обработке последовательностей, позволяя сосредоточиться на наиболее релевантной информации. Этот дизайн искусно сочетает в себе "глобальное взаимодействие" и "контролируемую сложность".
Однако реализовать единую диспетчеризацию внимания на основе модульного Web3 AI трудно. Во-первых, механизм внимания зависит от единого пространства Query-Key-Value, тогда как форматы данных и распределение, возвращаемые независимыми API, различаются. Во-вторых, модульная архитектура Web3 AI не имеет возможностей параллельной и многопутевой динамической настройки весов, что не позволяет смоделировать тонкую диспетчеризацию в механизме внимания. Наконец, между модулями отсутствует централизованный контекст с возможностью реального времени, что не позволяет реализовать глобальную связь и фокусировку между модулями.
Дискретная модульная сборка приводит к тому, что слияние признаков остается на поверхностном статическом соединении
"Слияние признаков" — это дальнейшее комбинирование векторных признаков, полученных после обработки различных модальностей, на основе выравнивания и внимания, чтобы использовать их непосредственно для задач нижнего уровня. Web3 AI в настоящее время находится на самой простой стадии объединения, так как предварительным условием динамического слияния признаков являются — высокоразмерное пространство и точный механизм внимания — которые не могут быть обеспечены.
Web2 AI склонен к энд-то-энд совместному обучению, обрабатывая многомодальные признаки одновременно в одном высокоразмерном пространстве, совместно оптимизируя с помощью слоев внимания и слияния с downstream задачами. В отличие от этого, Web3 AI в большей степени использует метод дискретной сборки модулей, что приводит к отсутствию единой цели обучения и межмодульного потока градиентов.
Процесс интеграции характеристик Web2 AI включает в себя различные высокоуровневые операции взаимодействия, такие как объединение векторов, сложение, билинейное объединение и т. д., что позволяет захватывать глубокие и сложные кросс-модальные связи. В то время как выходы различных агентов Web3 AI обычно содержат лишь несколько ключевых полей или показателей, что делает размерность характеристик крайне низкой и затрудняет выражение тонкой кросс-модальной информации.
Барьеры в AI-отрасли углубляются, но болевые точки еще не проявились
Многомодальная система Web2 AI является чрезвычайно крупным инженерным проектом, требующим огромных объемов данных, мощных вычислительных ресурсов, современных алгоритмов и сложной инженерной реализации. Это создает сильные барьеры для входа в индустрию и формирует核心竞争力少数 ведущих команд.
Web3 AI должен применять тактическую стратегию "окружение города деревнями", сначала пробуя свои силы в малых масштабах на периферийных сценах, и только после того, как будет обеспечена прочная база, ждать появления основных сцен. Преимущество Web3 AI заключается в децентрализации, что делает его подходящим для легковесных структур, легко параллельных и поощряемых задач, таких как дообучение LoRA, задачи постобучения с согласованием поведения, краудсорсинг для обучения и аннотирования данных, обучение небольших базовых моделей, а также совместное обучение на периферийных устройствах.
Однако на данный момент барьеры Web2 AI только начинают формироваться, и это ранняя стадия конкуренции среди ведущих компаний. Только когда выгоды от Web2 AI иссякнут, оставшиеся болевые точки станут возможностью для внедрения Web3 AI. До этого момента проекты Web3 AI должны осторожно выбирать точки входа, чтобы обеспечить постоянную итерацию и обновление продуктов в небольших сценариях, а также сохранять достаточную гибкость для адаптации к постоянно меняющимся рыночным требованиям.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
16 Лайков
Награда
16
4
Репост
Поделиться
комментарий
0/400
DogeBachelor
· 15ч назад
Просто заверните это, хех.
Посмотреть ОригиналОтветить0
SatoshiSherpa
· 15ч назад
Технологический рынок Будут играть для лохов.
Посмотреть ОригиналОтветить0
CryptoComedian
· 15ч назад
NVIDIA растет так, что я даже неудачников не могу себе позволить купить, эй.
Проблемы и прорывы Web3 AI: исследование стратегии окружения деревнями городов
Проблемы и будущие направления развития Web3 AI
Акции Nvidia снова достигли рекордных значений, а прогресс многомодальных моделей еще больше углубил технологический барьер Web2 AI. От семантической согласованности до визуального понимания, от высокоразмерных встраиваний до слияния признаков, сложные модели интегрируют различные способы выражения с беспрецедентной скоростью, создавая все более закрытую AI-высоту. Рынок акций США также подтвердил это на практике, как акции, связанные с криптовалютами, так и акции AI демонстрируют небольшую бычью тенденцию.
Однако этот бум, похоже, не имеет много общего с областью криптовалют. Недавние попытки в области Web3 AI, особенно исследования в направлении Agent, имеют значительные отклонения в направлении: попытка собрать многомодульную систему в стиле Web2 с использованием децентрализованной структуры на самом деле является двойным несоответствием как в технологии, так и в мышлении. В условиях высокой связности модулей, крайне нестабильного распределения признаков и постоянно растущих требований к вычислительной мощности, многомодульность в среде Web3 сталкивается с трудностями.
Будущее Web3 AI заключается не в простом подражании, а в стратегическом обходе. От семантического выравнивания в высокоразмерных пространствах до информационных узких мест в механизмах внимания и выравнивания признаков в условиях гетерогенной вычислительной мощности, Web3 AI необходимо применять тактическую стратегию "сельская осада города".
Web3 AI на основе плоской многомодальной модели, несоответствие семантики приводит к снижению производительности
В современных мультимодальных системах Web2 AI "семантическое выравнивание" позволяет отображать информацию из различных модальностей в одно и то же семантическое пространство, что позволяет моделям понимать и сопоставлять внутренние значения этих изначально различных сигналов. Высокоразмерное встраиваемое пространство является ключом к достижению этой цели.
Однако протокол Web3 Agent трудно реализовать с высоким размерным вложением. Большинство Web3 Agent просто упаковывают готовые API в отдельные "агенты", не имея единого центрального пространства вложения и кросс-модульного механизма внимания. Это приводит к тому, что информация не может взаимодействовать между модулями с разных углов и на разных уровнях, а работает только по линейному конвейеру, проявляя единственную функцию и не способствуя формированию общей замкнутой оптимизации.
Для реализации интеллектуального агента с барьерами для входа в отрасль необходимо преодолеть узкие места через совместное моделирование от начала до конца, унифицированное встраивание между модулями, а также систематическую инженерию совместного обучения и развертывания. Однако в настоящее время рынок не демонстрирует такой спрос.
В низкоразмерном пространстве механизм внимания нельзя точно спроектировать
Высокоэффективные многомодальные модели требуют тщательно спроектированных механизмов внимания. Механизм внимания по сути представляет собой способ динамического распределения вычислительных ресурсов, позволяя модели при обработке ввода одной модальности выборочно "сосредоточиваться" на наиболее релевантных частях.
Web2 AI при проектировании механизма внимания основывается на ключевой идее динамического распределения "весов внимания" для каждого элемента при обработке последовательностей, позволяя сосредоточиться на наиболее релевантной информации. Этот дизайн искусно сочетает в себе "глобальное взаимодействие" и "контролируемую сложность".
Однако реализовать единую диспетчеризацию внимания на основе модульного Web3 AI трудно. Во-первых, механизм внимания зависит от единого пространства Query-Key-Value, тогда как форматы данных и распределение, возвращаемые независимыми API, различаются. Во-вторых, модульная архитектура Web3 AI не имеет возможностей параллельной и многопутевой динамической настройки весов, что не позволяет смоделировать тонкую диспетчеризацию в механизме внимания. Наконец, между модулями отсутствует централизованный контекст с возможностью реального времени, что не позволяет реализовать глобальную связь и фокусировку между модулями.
Дискретная модульная сборка приводит к тому, что слияние признаков остается на поверхностном статическом соединении
"Слияние признаков" — это дальнейшее комбинирование векторных признаков, полученных после обработки различных модальностей, на основе выравнивания и внимания, чтобы использовать их непосредственно для задач нижнего уровня. Web3 AI в настоящее время находится на самой простой стадии объединения, так как предварительным условием динамического слияния признаков являются — высокоразмерное пространство и точный механизм внимания — которые не могут быть обеспечены.
Web2 AI склонен к энд-то-энд совместному обучению, обрабатывая многомодальные признаки одновременно в одном высокоразмерном пространстве, совместно оптимизируя с помощью слоев внимания и слияния с downstream задачами. В отличие от этого, Web3 AI в большей степени использует метод дискретной сборки модулей, что приводит к отсутствию единой цели обучения и межмодульного потока градиентов.
Процесс интеграции характеристик Web2 AI включает в себя различные высокоуровневые операции взаимодействия, такие как объединение векторов, сложение, билинейное объединение и т. д., что позволяет захватывать глубокие и сложные кросс-модальные связи. В то время как выходы различных агентов Web3 AI обычно содержат лишь несколько ключевых полей или показателей, что делает размерность характеристик крайне низкой и затрудняет выражение тонкой кросс-модальной информации.
Барьеры в AI-отрасли углубляются, но болевые точки еще не проявились
Многомодальная система Web2 AI является чрезвычайно крупным инженерным проектом, требующим огромных объемов данных, мощных вычислительных ресурсов, современных алгоритмов и сложной инженерной реализации. Это создает сильные барьеры для входа в индустрию и формирует核心竞争力少数 ведущих команд.
Web3 AI должен применять тактическую стратегию "окружение города деревнями", сначала пробуя свои силы в малых масштабах на периферийных сценах, и только после того, как будет обеспечена прочная база, ждать появления основных сцен. Преимущество Web3 AI заключается в децентрализации, что делает его подходящим для легковесных структур, легко параллельных и поощряемых задач, таких как дообучение LoRA, задачи постобучения с согласованием поведения, краудсорсинг для обучения и аннотирования данных, обучение небольших базовых моделей, а также совместное обучение на периферийных устройствах.
Однако на данный момент барьеры Web2 AI только начинают формироваться, и это ранняя стадия конкуренции среди ведущих компаний. Только когда выгоды от Web2 AI иссякнут, оставшиеся болевые точки станут возможностью для внедрения Web3 AI. До этого момента проекты Web3 AI должны осторожно выбирать точки входа, чтобы обеспечить постоянную итерацию и обновление продуктов в небольших сценариях, а также сохранять достаточную гибкость для адаптации к постоянно меняющимся рыночным требованиям.