Apple представила ИИ-модель для считывания контекста с экрана
Система получила название Reference Resolution As Language Modeling (ReALM) — «разрешение ссылок как моделирование языков». Она использует LLM для решения проблемы распознавания ссылок. Это позволяет ReALM добиться значительного прироста производительности по сравнению с существующими методами.
Для работы с экранными ссылками ReALM использует реконструкцию дисплея с помощью синтаксического анализа объектов на нем и их местоположения для создания текстового представления, передающего визуальную схему.
- 22 Мар, 12:49
Nvidia представила ИИ-модель для генерации 3D-объектов по промпту
«Latte3D создана командой лаборатории искусственного интеллекта Nvidia в Торонто. Она является значительным достижением в области ИИ, предлагая в реальном времени создавать 3D-объекты по текстовому запросу», — говорится в пресс-релизе.
По слов...