Summary & Insights
Imagine stepping off a plane in a new city and being greeted by a full-sized, lifelike holographic assistant that can instantly guide you to baggage claim, recommend nearby restaurants, and help you find your ride—all through a natural, spoken conversation. This is the near-future vision brought to life by Ja Li and LiveX AI, whose human-like AI agents are moving beyond screens and text chats to inhabit our physical spaces. Their technology combines a realistic human appearance, voice, and intelligence with the ability to take meaningful actions, aiming to bridge the gap between digital convenience and the in-person experiences that still dominate areas like retail, where 80% of shopping occurs.
A major proving ground for this technology is unfolding during Super Bowl week, where LiveX has over 20 activations planned. Their flagship agent, Lyra, will assist fans from airports to fan zones, handling everything from wayfinding and event schedules to emergency guidance and celebratory selfies. This demonstrates a shift from passive information kiosks to proactive, engaging companions that enhance safety and create memorable moments. For sports leagues and brands, it represents a new paradigm for fan engagement, offering scalable, personalized interaction that was previously impossible.
On the technical front, creating a seamless experience requires solving significant challenges in efficiency and accuracy. Latency is critical; a laggy agent in a crowded stadium is useless. By leveraging NVIDIA’s full stack—including NIM microservices, Triton inference, and RTX GPUs—LiveX achieved a six-fold increase in processing speed, enabling complex, multi-step interactions in real time. This partnership allows them to deploy on-premise hardware in connectivity-poor environments like convention centers, ensuring reliability. The goal is for these agents to eventually become a ubiquitous interface wherever there’s a screen or space for interaction, expanding into hospitality, healthcare, and daily life.
Surprising Insights
- The Physical Shopping Dominance: Despite the rise of e-commerce, 80% of shopping in the U.S. still happens in-person, creating a massive, underserved market for in-store AI assistance.
- Agents as Emergency Guides: The applications extend beyond customer service to public safety, with AI holograms being designed to provide calm, clear instructions during emergencies like fires or evacuations in crowded venues.
- The Latency Imperative: For AI agents to be useful in real-world, mission-critical scenarios, they require near-instantaneous responses. The benchmark is human conversation speed, not the slightly delayed replies acceptable in text-based chatbots.
- The On-Premise Necessity: For large, crowded events with unreliable internet, the solution isn’t cloud-based but powerful, on-premise GPU workstations that can handle the inference load locally without lag.
Practical Takeaways
- Design for the Human Channel: When planning AI interactions for the public, prioritize voice and visual interfaces over text. Humans connect and process information far more naturally through conversation and facial expression than through typing.
- Prioritize Real-Time Performance: If building interactive agents for dynamic environments, invest in inference optimization. A delay of even a minute can render the technology frustrating and useless for users in motion.
- Bridge the Digital-Physical Data Gap: For retail and hospitality, the next competitive edge lies in using AI agents to bring personalized, online-style recommendations and inventory knowledge directly to the customer in the physical aisle or lobby.
- Start with High-Impact, High-Traffic Scenarios: The most logical deployment sites for this technology are places where human assistance is stretched thin but needed most: major events, flagship retail stores, airports, and hospitals.
Một thử nghiệm lớn cho công nghệ này đang diễn ra trong tuần lễ Super Bowl, nơi LiveX có hơn 20 điểm triển khai kích hoạt. Nhân vật hàng đầu của họ, Lyra, sẽ hỗ trợ người hâm mộ từ sân bay đến các khu vực dành cho fan, xử lý mọi thứ từ chỉ đường và lịch trình sự kiện đến hướng dẫn khẩn cấp và chụp ảnh tự sướng kỷ niệm. Điều này cho thấy sự chuyển dịch từ các trạm thông tin thụ động sang những người bạn đồng hành chủ động, hấp dẫn, giúp nâng cao an toàn và tạo ra những khoảnh khắc đáng nhớ. Đối với các giải đấu thể thao và thương hiệu, nó đại diện cho một mô hình mới trong việc thu hút người hâm mộ, mang lại tương tác cá nhân hóa và có thể mở rộng vốn trước đây là không thể.
Về mặt kỹ thuật, tạo ra trải nghiệm liền mạch đòi hỏi giải quyết những thách thức lớn về hiệu quả và độ chính xác. Độ trễ là yếu tố then chốt; một tác nhân giật lag trong một sân vận động đông đúc là vô dụng. Bằng cách tận dụng toàn bộ kiến trúc của NVIDIA—bao gồm các microservice NIM, nền tảng suy luận Triton và GPU RTX—LiveX đã đạt được tốc độ xử lý nhanh hơn sáu lần, cho phép các tương tác phức tạp, nhiều bước diễn ra trong thời gian thực. Sự hợp tác này cho phép họ triển khai phần cứng tại chỗ trong các môi trường kết nối kém như trung tâm hội nghị, đảm bảo độ tin cậy. Mục tiêu là để các tác nhân này cuối cùng trở thành giao diện phổ biến ở bất cứ nơi nào có màn hình hoặc không gian cho tương tác, mở rộng sang lĩnh vực khách sạn, chăm sóc sức khỏe và cuộc sống hàng ngày.
### Những Hiểu Biết Bất Ngờ
– **Sự Thống Trị của Mua Sắm Trực Tiếp:** Bất chấp sự phát triển của thương mại điện tử, 80% việc mua sắm tại Mỹ vẫn diễn ra trực tiếp, tạo ra một thị trường khổng lồ, chưa được đáp ứng đầy đủ cho hỗ trợ AI tại cửa hàng.
– **Tác Nhân như Hướng Dẫn Viên Khẩn Cấp:** Các ứng dụng mở rộng ra ngoài dịch vụ khách hàng đến an toàn công cộng, với hologram AI được thiết kế để cung cấp hướng dẫn bình tĩnh, rõ ràng trong các trường hợp khẩn cấp như hỏa hoạn hoặc sơ tán tại các địa điểm đông đúc.
– **Tính Cấp Thiết của Độ Trễ:** Để các tác nhân AI hữu ích trong các tình huống thực tế và quan trọng, chúng cần phản hồi gần như tức thời. Tiêu chuẩn là tốc độ hội thoại của con người, không phải những phản hồi bị trễ một chút có thể chấp nhận được trong các chatbot dựa trên văn bản.
– **Sự Cần Thiết của Triển Khai Tại Chỗ:** Đối với các sự kiện lớn, đông người với kết nối internet không ổn định, giải pháp không phải là điện toán đám mây mà là các máy trạm GPU mạnh mẽ, triển khai tại chỗ, có thể xử lý khối lượng suy luận cục bộ mà không bị trễ.
### Những Bài Học Thực Tiễn
– **Thiết Kế Cho Kênh Giao Tiếp Của Con Người:** Khi lập kế hoạch tương tác AI cho công chúng, hãy ưu tiên giao diện giọng nói và hình ảnh hơn văn bản. Con người kết nối và xử lý thông tin một cách tự nhiên hơn nhiều thông qua hội thoại và biểu cảm khuôn mặt so với việc gõ phím.
– **Ưu Tiên Hiệu Suất Thời Gian Thực:** Nếu xây dựng các tác nhân tương tác cho môi trường năng động, hãy đầu tư vào tối ưu hóa suy luận. Ngay cả một phút trễ cũng có thể khiến công nghệ trở nên khó chịu và vô dụng đối với người dùng đang di chuyển.
– **Thu Hẹp Khoảng Cách Dữ Liệu Kỹ Thuật Số – Thực Tế:** Đối với bán lẻ và khách sạn, lợi thế cạnh tranh tiếp theo nằm ở việc sử dụng các tác nhân AI để mang các đề xuất cá nhân hóa, kiểu trực tuyến và kiến thức về hàng tồn kho trực tiếp đến khách hàng tại gian hàng vật lý hoặc sảnh đợi.
– **Bắt Đầu Với Các Kịch Bản Có Tác Động Cao và Lưu Lượng Lớn:** Các địa điểm triển khai hợp lý nhất cho công nghệ này là những nơi sự hỗ trợ của con người bị hạn chế nhưng lại cần thiết nhất: các sự kiện lớn, cửa hàng bán lẻ hàng đầu, sân bay và bệnh viện.
想像一下,當你踏上異鄉機場,迎接你的竟是一位與真人無異的全息影像助理。它能用自然對話引領你提取行李、推薦周邊餐廳、協助預約車輛——這正是賈力與LiveX AI攜手打造的近未來願景。他們研發的類人AI智能體正突破螢幕與文字對話的侷限,走入我們的實體空間。這項技術結合擬真外貌、語音、智能與實質行動能力,旨在彌合數位便利性與實體體驗間的鴻溝。在零售這類仍有80%消費發生於線下的領域,此變革尤具意義。
超級盃賽事週成為這項技術的重要試驗場,LiveX規劃了超過20個互動站點。其旗艦智能體「萊拉」將於機場至球迷區全程協助,涵蓋導航、賽程查詢、緊急指引乃至慶祝自拍等多元服務。這標誌著傳統被動式資訊站,正轉型為能提升安全性、創造難忘體驗的主動陪伴型助手。對運動聯盟與品牌而言,這開創了可規模化、高度個人化的粉絲互動新範式。
技術層面上,流暢體驗需克服效率與準確度的重大挑戰。延遲問題至關重要:在擁擠的體育館中,反應遲滯的智能體毫無價值。透過整合NVIDIA全端技術——包含NIM微服務、Triton推理平台與RTX GPU——LiveX將處理速度提升六倍,實現複雜多步驟的即時互動。此合作使他們能在會展中心等網路不穩環境部署本地硬體,確保運作可靠性。終極目標是讓這類智能體成為所有螢幕與互動空間的泛在介面,逐步擴展至酒店、醫療與日常生活場域。
顛覆性洞察
- 實體消費的韌性:儘管電商崛起,美國仍有80%購物行為發生於線下,這為店內AI輔助創造龐大未開發市場。
- 緊急狀況指引者:應用場景超越客服範疇,全息AI助理可於火災、疏散等緊急情況,在密集場所提供沉靜清晰的指令。
- 延遲控制的剛需:在現實世界的關鍵任務場景中,AI智能體必須實現近乎即時的回應——標準是人類對話速度,而非文字聊天中可接受的微小延遲。
- 本地部署的必要性:針對網路不穩的大型聚集活動,解決方案並非雲端運算,而是能本地處理推理任務、無延遲的高效能GPU工作站。
實戰啟示
- 以人本體驗為設計核心:規劃公共AI互動時,應優先考慮語音與視覺介面。相較於文字輸入,人類更擅長透過對話與表情進行自然溝通。
- 聚焦即時效能優化:開發動態環境互動智能體時,必須投資推理優化技術。在移動場景中,即使僅一分鐘延遲也會令技術價值歸零。
- 打通數位實體資料流:零售與酒店業的下個競爭優勢,在於透過AI智能體將個人化線上推薦與庫存資訊,直接帶入實體賣場或大廳。
- 從高流量高影響場景切入:最適部署場域為人力吃緊卻需求旺盛之處:大型活動、旗艦店、機場與醫療機構。
Imagina bajarte de un avión en una ciudad nueva y que te reciba un asistente holográfico de tamaño real y aspecto realista, capaz de guiarte al instante hasta la zona de recogida de equipaje, recomendarte restaurantes cercanos y ayudarte a encontrar tu transporte, todo ello mediante una conversación natural y hablada. Esta es la visión de un futuro cercano hecha realidad por Ja Li y LiveX AI, cuyos agentes de IA con apariencia humana están yendo más allá de las pantallas y los chats de texto para habitar nuestros espacios físicos. Su tecnología combina una apariencia humana realista, voz e inteligencia con la capacidad de realizar acciones significativas, con el objetivo de cerrar la brecha entre la comodidad digital y las experiencias presenciales que siguen dominando ámbitos como el comercio minorista, donde ocurre el 80% de las compras.
Una importante prueba de esta tecnología se está desarrollando durante la semana del Super Bowl, donde LiveX tiene previstas más de 20 activaciones. Su agente insignia, Lyra, ayudará a los aficionados desde los aeropuertos hasta las zonas para fans, encargándose de todo, desde orientación y horarios de eventos hasta indicaciones de emergencia y selfis conmemorativos. Esto demuestra un cambio desde los kioscos de información pasivos hacia compañeros proactivos y atractivos que mejoran la seguridad y crean momentos memorables. Para las ligas deportivas y las marcas, representa un nuevo paradigma de interacción con los aficionados, al ofrecer una interacción escalable y personalizada que antes era imposible.
En el frente técnico, crear una experiencia fluida requiere resolver desafíos importantes de eficiencia y precisión. La latencia es crucial; un agente con retrasos en un estadio lleno no sirve de nada. Al aprovechar la pila tecnológica completa de NVIDIA —incluidos los microservicios NIM, la inferencia Triton y las GPU RTX—, LiveX logró un aumento de seis veces en la velocidad de procesamiento, lo que permite interacciones complejas de múltiples pasos en tiempo real. Esta colaboración les permite desplegar hardware local en entornos con mala conectividad, como centros de convenciones, garantizando fiabilidad. El objetivo es que estos agentes lleguen a convertirse en una interfaz ubicua allí donde haya una pantalla o espacio para interactuar, expandiéndose hacia la hostelería, la salud y la vida cotidiana.
Ideas sorprendentes
- El predominio de las compras presenciales: A pesar del auge del comercio electrónico, el 80% de las compras en EE. UU. todavía se realiza en persona, lo que crea un mercado enorme y poco atendido para la asistencia de IA en tienda.
- Agentes como guías de emergencia: Las aplicaciones van más allá de la atención al cliente y alcanzan la seguridad pública, ya que los hologramas de IA se están diseñando para ofrecer instrucciones calmadas y claras durante emergencias como incendios o evacuaciones en recintos concurridos.
- La exigencia de una baja latencia: Para que los agentes de IA sean útiles en escenarios reales y de misión crítica, necesitan respuestas casi instantáneas. La referencia es la velocidad de una conversación humana, no las respuestas ligeramente retrasadas aceptables en los chatbots basados en texto.
- La necesidad de infraestructura local: Para eventos grandes y concurridos con internet poco fiable, la solución no está en la nube, sino en potentes estaciones de trabajo con GPU instaladas localmente que puedan gestionar la carga de inferencia sin retrasos.
Conclusiones prácticas
- Diseña para el canal humano: Al planificar interacciones de IA para el público, prioriza las interfaces de voz y visuales por encima del texto. Los seres humanos conectan y procesan la información de manera mucho más natural mediante la conversación y la expresión facial que escribiendo.
- Prioriza el rendimiento en tiempo real: Si estás desarrollando agentes interactivos para entornos dinámicos, invierte en la optimización de la inferencia. Un retraso de incluso un minuto puede hacer que la tecnología resulte frustrante e inútil para usuarios en movimiento.
- Cierra la brecha de datos entre lo digital y lo físico: En comercio minorista y hostelería, la próxima ventaja competitiva radica en utilizar agentes de IA para llevar recomendaciones personalizadas al estilo online y conocimiento del inventario directamente al cliente en el pasillo o en el vestíbulo físico.
- Empieza por escenarios de alto impacto y gran afluencia: Los lugares más lógicos para desplegar esta tecnología son aquellos donde la asistencia humana escasea pero más se necesita: grandes eventos, tiendas insignia, aeropuertos y hospitales.
Imagine descer de um avião em uma nova cidade e ser recebido por um assistente holográfico em tamanho real, realista, capaz de guiá-lo instantaneamente até a retirada de bagagens, recomendar restaurantes próximos e ajudá-lo a encontrar seu transporte — tudo por meio de uma conversa natural, falada. Essa é a visão de um futuro próximo concretizada por Ja Li e pela LiveX AI, cujos agentes de IA com aparência humana estão indo além das telas e dos chats de texto para ocupar nossos espaços físicos. Sua tecnologia combina uma aparência humana realista, voz e inteligência com a capacidade de executar ações significativas, com o objetivo de preencher a lacuna entre a conveniência digital e as experiências presenciais que ainda dominam áreas como o varejo, onde 80% das compras acontecem.
Um importante campo de testes para essa tecnologia está se desenrolando durante a semana do Super Bowl, em que a LiveX tem mais de 20 ativações planejadas. Seu agente principal, Lyra, ajudará os fãs desde os aeroportos até as áreas dedicadas aos torcedores, cuidando de tudo, desde orientação de trajeto e programação de eventos até instruções de emergência e selfies comemorativas. Isso demonstra uma mudança de quiosques passivos de informação para companheiros proativos e envolventes que aumentam a segurança e criam momentos memoráveis. Para ligas esportivas e marcas, isso representa um novo paradigma de engajamento dos fãs, oferecendo uma interação escalável e personalizada que antes era impossível.
No campo técnico, criar uma experiência fluida exige resolver desafios significativos de eficiência e precisão. A latência é crítica; um agente com atraso em um estádio lotado é inútil. Ao aproveitar toda a stack da NVIDIA — incluindo microserviços NIM, inferência Triton e GPUs RTX — a LiveX alcançou um aumento de seis vezes na velocidade de processamento, possibilitando interações complexas de múltiplas etapas em tempo real. Essa parceria permite implantar hardware local em ambientes com pouca conectividade, como centros de convenções, garantindo confiabilidade. O objetivo é que esses agentes eventualmente se tornem uma interface onipresente onde quer que haja uma tela ou espaço para interação, expandindo-se para hospitalidade, saúde e a vida cotidiana.
Percepções Surpreendentes
- O Predomínio das Compras Físicas: Apesar do crescimento do comércio eletrônico, 80% das compras nos EUA ainda acontecem presencialmente, criando um mercado enorme e pouco atendido para assistência de IA nas lojas.
- Agentes como Guias de Emergência: As aplicações vão além do atendimento ao cliente e alcançam a segurança pública, com hologramas de IA sendo projetados para fornecer instruções calmas e claras durante emergências, como incêndios ou evacuações em locais lotados.
- O Imperativo da Latência: Para que agentes de IA sejam úteis em cenários reais e críticos, eles precisam de respostas quase instantâneas. O parâmetro de referência é a velocidade da conversa humana, e não as respostas levemente atrasadas aceitáveis em chatbots baseados em texto.
- A Necessidade de Infraestrutura Local: Para grandes eventos lotados com internet pouco confiável, a solução não está na nuvem, mas em estações de trabalho poderosas com GPUs locais, capazes de lidar com a carga de inferência sem atraso.
Conclusões Práticas
- Projete para o Canal Humano: Ao planejar interações públicas com IA, priorize interfaces de voz e visuais em vez de texto. Os seres humanos se conectam e processam informações de forma muito mais natural por meio da conversa e da expressão facial do que pela digitação.
- Priorize o Desempenho em Tempo Real: Se estiver criando agentes interativos para ambientes dinâmicos, invista na otimização da inferência. Um atraso de até mesmo um minuto pode tornar a tecnologia frustrante e inútil para usuários em movimento.
- Preencha a Lacuna de Dados entre o Digital e o Físico: Para varejo e hospitalidade, a próxima vantagem competitiva está em usar agentes de IA para levar recomendações personalizadas no estilo online e conhecimento de inventário diretamente ao cliente no corredor da loja ou no saguão.
- Comece por Cenários de Alto Impacto e Alto Fluxo: Os locais mais lógicos para implantar essa tecnologia são aqueles em que a assistência humana é mais necessária, mas também mais escassa: grandes eventos, lojas-conceito, aeroportos e hospitais.
How are real‑time 4K holograms that look, sound, and respond like people changing fan engagement? Jia Li, co‑founder, president, and chief AI officer of LiveX AI, shares how human‑like AI agents bridge the digital and physical worlds—from greeting travelers at airports to guiding fans through fan zones and supporting wayfinding at major sports events.
Join the world’s premier AI conference: NVIDIA GTC

Leave a Reply
You must be logged in to post a comment.