0
0
Summary & Insights

Imagine having a digital clone that can speak 140 languages while your real self is limited to just three. That’s the reality Maria Garib faced when she encountered her own AI avatar created by Synthesia, a moment that perfectly encapsulates the surreal and practical advancements in synthetic media. In this conversation with Synthesia’s CEO Victor Rappavalli, the discussion moves beyond simple digital twins to explore how AI is fundamentally reshaping communication, learning, and business workflows by making video as easy to produce as a PowerPoint slide.

The core thesis is that AI is driving the marginal cost of video production—in terms of money, time, and skill—toward zero, much like how personal computers democratized writing. This isn’t just about creating marketing clips; it’s about replacing entire layers of internal business communication. Rappavalli envisions a future where static documents, training manuals, and internal memos are replaced by dynamic, personalized video. More than that, video itself is evolving from a passive broadcast medium into an interactive “agent” you can converse with, such as a training module that turns into a role-playing sales coach or a tutorial that answers your follow-up questions in real time.

For businesses today, the most immediate impact is in the “middle layer” of communication. Synthesia sees its technology not yet for Hollywood-grade ads, but for the vast quantity of internal training, product explainers, and customer onboarding that currently exists as forgettable slides or text. Companies like UBS and Heineken are already using avatar videos to communicate complex analyses and training more effectively, seeing significant gains in engagement and speed. The guiding principle is “utility over novelty,” focusing on real ROI in cost reduction, faster content creation, and better information retention rather than flashy, experimental projects.

Surprising Insights

  • The Most Niche Use Case: One of the earliest adopters was a barbershop in Brazil that used the platform to create videos showcasing different haircut styles for its Facebook page, demonstrating the technology’s reach far beyond corporate use cases.
  • The Critical Role of Accent: A major barrier to avatar adoption isn’t just visual uncanny valley, but vocal dissonance. People are highly sensitive to their digital clone having the wrong regional accent, which is why Synthesia built its own voice model specifically designed to preserve vocal nuances.
  • A Defense of Shorter Attention Spans: Rappavalli challenges the narrative that shorter attention spans are solely due to “brain rot.” He suggests it might be a rational response to an abundance of content, where audiences naturally gravitate toward the most efficient and engaging format—like a well-made video over a dense 250-page book—forcing content to be better.
  • Licensed Data as a Differentiator: Unlike many generative AI companies, Synthesia proactively licenses training data (e.g., from Shutterstock), betting that high-quality, legally-sourced input leads to superior output and provides a foundation of trust for enterprise clients.
  • The Future of Hiring: Interactive AI video agents could make hiring fairer by allowing candidates to demonstrate skills through a live case study with an AI, moving beyond resume-screening biases and giving a more equitable chance to applicants from non-traditional backgrounds.

Practical Takeaways

  • Start by Replacing Internal Documents: For fast wins, look at the PowerPoint decks, wiki pages, and text-based training materials in your organization. Converting these to avatar-led videos can boost asynchronous engagement and retention.
  • Avoid the “Super Bowl Ad” Mistake: The rookie error is being overly ambitious and trying to create flagship advertising campaigns with current avatar tech. Focus instead on practical, high-volume communication where authenticity is valued but production budgets are low.
  • Prioritize Vocal Authenticity: If creating a personal avatar, ensure you provide high-quality voice samples. The realism of the avatar hinges as much on it sounding like you—down to your specific accent—as it does on visual fidelity.
  • Use AI to Expand, Not Replace, Human Interaction: Consider using personalized avatar videos for scalable, one-to-one touchpoints (like welcoming new newsletter subscribers), freeing up your actual time for deeper, real human connections where they matter most.
  • Cultivate Creativity and Critical Thinking: As AI handles more execution, the most future-proof skills will be the human abilities to conceive original ideas, ask the right questions, and critically evaluate information—skills that define what’s worth building in the first place.

Hãy tưởng tượng bạn có một bản sao kỹ thuật số có thể nói 140 ngôn ngữ trong khi bản thân thực sự của bạn chỉ giới hạn ở ba. Đó là thực tế mà Maria Garib đối mặt khi cô gặp gỡ phiên bản AI của chính mình do Synthesia tạo ra, một khoảnh khắc hoàn hảo minh họa cho những tiến bộ siêu thực nhưng thiết thực trong phương tiện tổng hợp. Trong cuộc trò chuyện với CEO Synthesia Victor Rappavalli, cuộc thảo luận vượt ra ngoài khái niệm bản sao kỹ thuật số đơn thuần để khám phá cách AI đang định hình lại cơ bản giao tiếp, học tập và quy trình làm việc kinh doanh bằng cách biến video trở nên dễ sản xuất như một slide PowerPoint.


Luận điểm cốt lõi là AI đang đẩy chi phí biên của sản xuất video—về tiền bạc, thời gian và kỹ năng—tiến về mức không, giống như cách máy tính cá nhân dân chủ hóa việc viết lách. Đây không chỉ là tạo clip tiếp thị; mà là thay thế toàn bộ các tầng giao tiếp nội bộ trong doanh nghiệp. Rappavalli hình dung một tương lai mà các tài liệu tĩnh, sổ tay đào tạo và thông báo nội bộ được thay thế bằng video động, cá nhân hóa. Hơn thế, bản thân video đang phát triển từ một phương tiện phát sóng thụ động thành một “tác nhân” tương tác mà bạn có thể trò chuyện cùng, chẳng hạn như một mô-đun đào tạo biến thành huấn luyện viên bán hàng đóng vai hoặc một hướng dẫn trả lời câu hỏi tiếp theo của bạn trong thời gian thực.


Đối với các doanh nghiệp hiện nay, tác động trực tiếp nhất nằm ở “tầng giữa” của giao tiếp. Synthesia nhìn thấy công nghệ của mình hiện không dành cho quảng cáo cấp Hollywood, mà cho khối lượng lớn đào tạo nội bộ, giải thích sản phẩm và hướng dẫn khách hàng hiện đang tồn tại dưới dạng slide hoặc văn bản dễ bị lãng quên. Các công ty như UBS và Heineken đã sử dụng video avatar để truyền đạt phân tích phức tạp và đào tạo hiệu quả hơn, đạt được những cải thiện đáng kể về mức độ tương tác và tốc độ. Nguyên tắc chỉ đạo là “tính hữu dụng hơn sự mới lạ”, tập trung vào ROI thực sự trong việc giảm chi phí, tạo nội dung nhanh hơn và khả năng lưu giữ thông tin tốt hơn thay vì những dự án thử nghiệm hào nhoang.


Những Góc Nhìn Bất Ngờ



  • Trường hợp Sử dụng Đặc Thù Nhất: Một trong những người dùng sớm nhất là một tiệm cắt tóc ở Brazil đã sử dụng nền tảng này để tạo video giới thiệu các kiểu tóc khác nhau cho trang Facebook của họ, cho thấy phạm vi tiếp cận của công nghệ vượt xa các trường hợp sử dụng doanh nghiệp.

  • Vai trò Quan trọng của Chất giọng: Rào cản chính đối với việc chấp nhận avatar không chỉ là hiệu ứng “thung lũng kỳ lạ” về hình ảnh, mà còn là sự mất hòa hợp về giọng nói. Mọi người cực kỳ nhạy cảm với việc bản sao kỹ thuật số của họ có chất giọng vùng miền sai lệch, đó là lý do Synthesia xây dựng mô hình giọng nói riêng được thiết kế đặc biệt để giữ lại những sắc thái tinh tế.

  • Một Lời Bảo vệ cho Khoảng Chú ý Ngắn hơn: Rappavalli thách thức quan điểm cho rằng khoảng chú ý ngắn hơn chỉ là do “não bị hủy hoại.” Ông gợi ý rằng đó có thể là một phản ứng hợp lý trước lượng nội dung dồi dào, khi khán giả tự nhiên bị thu hút bởi định dạng hiệu quả và hấp dẫn nhất—như một video được làm tốt so với một cuốn sách dày 250 trang dày đặc—buộc nội dung phải trở nên tốt hơn.

  • Dữ liệu được Cấp phép như Điểm Khác biệt: Không giống nhiều công ty AI sinh tạo, Synthesia chủ động cấp phép dữ liệu đào tạo (ví dụ từ Shutterstock), đặt cược rằng đầu vào chất lượng cao, có nguồn hợp pháp sẽ dẫn đến đầu ra vượt trội và tạo nền tảng tin cậy cho khách hàng doanh nghiệp.

  • Tương lai của Tuyển dụng: Các tác nhân video AI tương tác có thể làm cho việc tuyển dụng công bằng hơn bằng cách cho phép ứng viên thể hiện kỹ năng thông qua một nghiên cứu tình huống trực tiếp với AI, vượt ra ngoài định kiến sàng lọc hồ sơ và mang lại cơ hội công bằng hơn cho ứng viên từ các nền tảng phi truyền thống.


Điểm Cốt lõi Thực tiễn



  • Bắt đầu bằng việc Thay thế Tài liệu Nội bộ: Để đạt thành quả nhanh, hãy xem xét các bản thuyết trình PowerPoint, trang wiki và tài liệu đào tạo dạng văn bản trong tổ chức của bạn. Chuyển đổi chúng thành video dẫn dắt bởi avatar có thể thúc đẩy sự tương tác không đồng bộ và khả năng ghi nhớ.

  • Tránh Sai lầm “Quảng cáo Super Bowl”: Sai lầm của người mới là quá tham vọng và cố gắng tạo các chiến dịch quảng cáo hàng đầu với công nghệ avatar hiện tại. Thay vào đó, hãy tập trung vào giao tiếp thiết thực, số lượng lớn nơi tính chân thực được coi trọng nhưng ngân sách sản xuất thấp.

  • Ưu tiên Tính Chân thực về Giọng nói: Nếu tạo một avatar cá nhân, hãy đảm bảo bạn cung cấp mẫu giọng nói chất lượng cao. Tính chân thực của avatar phụ thuộc nhiều vào việc nó nghe giống bạn—đến từng chất giọng cụ thể của bạn—cũng như vào độ trung thực hình ảnh.

  • Sử dụng AI để Mở rộng, không Thay thế, Tương tác Con người: Hãy cân nhắc sử dụng video avatar cá nhân hóa cho các điểm tiếp xúc một-một có thể mở rộng (như chào mừng người đăng ký bản tin mới), giải phóng thời gian thực tế của bạn cho những kết nối con người thực sự sâu sắc hơn ở những nơi quan trọng nhất.

  • Nuôi dưỡng Sáng tạo và Tư duy Phản biện: Khi AI đảm nhận nhiều hơn việc thực thi, những kỹ năng bền vững nhất với tương lai sẽ là khả năng của con người trong việc hình thành ý tưởng độc đáo, đặt câu hỏi đúng và đánh giá thông tin một cách phản biện—những kỹ năng định nghĩa điều gì đáng để xây dựng ngay từ đầu.


想像一下,有個數位分身能說140種語言,而你本人卻只會三種——這正是瑪麗亞·加里布面對自身AI虛擬化身時的現實。當她遇見由Synthesia打造的數位自我時,這一刻完美體現了合成媒體技術既超現實又實用的飛躍。在與Synthesia執行長維克多·拉帕瓦利的對話中,焦點超越單純的數位分身概念,深入探討AI如何讓影片製作變得像製作簡報般簡單,從而從根本上重塑溝通、學習與商業工作流程。


核心論點是:AI正將影片製作的邊際成本(金錢、時間與技能層面)趨近於零,正如個人電腦使書寫普及化。這不僅關乎行銷影片製作,更在於取代整個企業內部溝通層級。拉帕瓦利預見靜態文件、訓練手冊與內部備忘錄將被動態個人化影片取代。不僅如此,影片正從被動傳播媒介演化為可對話的互動「智能體」,例如轉為角色扮演銷售教練的培訓模組,或能即時回應後續問題的教學影片。


對當代企業而言,最直接的衝擊在於溝通「中間層」。Synthesia認為其技術尚未用於好萊塢級廣告,而是針對海量內部培訓、產品說明與客戶引導——這些目前多由易被遺忘的簡報或文字構成。瑞銀集團與海尼根等企業已運用虛擬分身影片有效溝通複雜分析與培訓內容,在參與度與效率上獲得顯著提升。指導原則是「實用優先於新奇」,聚焦於降低成本的實質投資回報、加速內容產製及提升資訊記憶率,而非華而不實的實驗性專案。


令人驚奇的洞見



  • 最特殊的應用案例:最早期的使用者之一竟是巴西理髮廳,他們透過平台製作展示不同髮型的影片發布於臉書頁面,顯示此技術的應用遠超越企業場景。

  • 口音的關鍵作用:虛擬分身普及的主要障礙不僅是視覺上的詭異感,更在於聲音的不協調。人們對數位分身擁有錯誤地域口音極度敏感,因此Synthesia專門建立能保留聲音細微特質的專屬語音模型。

  • 為短注意力辯護:拉帕瓦利挑戰「注意力縮短純粹源於腦力衰退」的論述,認為這可能是對內容爆炸的理性回應:受眾自然傾向最有效率且吸引人的形式(例如精製影片對比厚重的250頁書籍),這反而迫使內容品質提升。

  • 授權資料作為差異化優勢:有別於多數生成式AI公司,Synthesia主動獲取訓練資料授權(如來自Shutterstock),相信優質合法的資料來源能產出更佳成果,並為企業客戶建立信任基礎。

  • 招聘的未來:互動式AI影片智能體可使招聘更公平,讓求職者透過與AI進行即時案例研究展現技能,超越履歷篩選的偏見,為非傳統背景申請者提供更平等機會。


實用建議



  • 從取代內部文件著手:為快速見效,可審視組織內的簡報檔、維基頁面與文字培訓材料,將其轉為虛擬分身引導的影片,以提升非同步參與度與記憶保留率。

  • 避免「超級盃廣告」謬誤:新手常犯的錯誤是過度野心勃勃,試圖用現有虛擬分身技術製作旗艦廣告活動。應專注於實用、高頻率的溝通場景——這些情境重視真實性但製作預算有限。

  • 優先確保聲音真實性:若創建個人虛擬分身,務必提供高品質聲音樣本。分身的真實感不僅取決於視覺擬真度,更關乎其是否連你的特定口音都完美復現。

  • 以AI拓展而非取代人際互動:可考慮使用個人化虛擬分身影片進行可擴展的一對一接觸(如歡迎新訂閱者),從而釋放真實時間,用於更深層且重要的人際連結。

  • 培養創造力與批判思維:當AI承擔更多執行工作時,最經得起未來考驗的技能將是人類構思原創觀點、提出關鍵問題與批判性評估資訊的能力——這些正是決定「何者值得構建」的核心技能。


Imagina tener un clon digital capaz de hablar 140 idiomas mientras tu yo real está limitado a solo tres. Esa fue la realidad a la que se enfrentó Maria Garib cuando conoció su propio avatar de IA creado por Synthesia, un momento que encapsula a la perfección los avances surrealistas y prácticos de los medios sintéticos. En esta conversación con el director ejecutivo de Synthesia, Victor Rappavalli, el debate va más allá de los simples gemelos digitales para explorar cómo la IA está transformando de manera fundamental la comunicación, el aprendizaje y los flujos de trabajo empresariales al hacer que producir video sea tan fácil como crear una diapositiva de PowerPoint.


La tesis central es que la IA está llevando el costo marginal de la producción de video —en dinero, tiempo y habilidad— hacia cero, de forma muy similar a como las computadoras personales democratizaron la escritura. No se trata solo de crear clips de marketing; se trata de reemplazar capas enteras de comunicación interna en las empresas. Rappavalli imagina un futuro en el que los documentos estáticos, los manuales de formación y los memorandos internos sean sustituidos por video dinámico y personalizado. Más aún, el propio video está evolucionando de un medio pasivo de difusión a un “agente” interactivo con el que se puede conversar, como un módulo de capacitación que se convierte en un coach de ventas basado en juegos de rol o un tutorial que responde tus preguntas de seguimiento en tiempo real.


Para las empresas de hoy, el impacto más inmediato está en la “capa intermedia” de la comunicación. Synthesia considera que su tecnología aún no está destinada a anuncios con calidad de Hollywood, sino a la enorme cantidad de capacitaciones internas, explicaciones de productos e incorporación de clientes que actualmente existen como diapositivas olvidables o texto. Empresas como UBS y Heineken ya están usando videos con avatares para comunicar análisis complejos y formaciones de manera más efectiva, logrando mejoras significativas en participación y rapidez. El principio rector es “utilidad por encima de novedad”, poniendo el foco en un ROI real en reducción de costos, creación más rápida de contenido y mejor retención de información, en lugar de proyectos llamativos y experimentales.


Ideas sorprendentes



  • El caso de uso más nicho: Uno de los primeros usuarios fue una barbería en Brasil que utilizó la plataforma para crear videos mostrando distintos estilos de corte de pelo para su página de Facebook, lo que demuestra que el alcance de la tecnología va mucho más allá de los casos de uso corporativos.

  • El papel crítico del acento: Una gran barrera para la adopción de avatares no es solo el inquietante efecto visual, sino la disonancia vocal. Las personas son muy sensibles a que su clon digital tenga el acento regional equivocado, razón por la cual Synthesia desarrolló su propio modelo de voz, diseñado específicamente para preservar los matices vocales.

  • Una defensa de la menor capacidad de atención: Rappavalli cuestiona la narrativa de que la reducción de la capacidad de atención se deba únicamente al “deterioro mental”. Sugiere que podría ser una respuesta racional a la abundancia de contenido, en la que las audiencias gravitan naturalmente hacia el formato más eficiente y atractivo —como un video bien hecho frente a un libro denso de 250 páginas—, lo que obliga al contenido a ser mejor.

  • Los datos con licencia como factor diferenciador: A diferencia de muchas empresas de IA generativa, Synthesia obtiene proactivamente licencias para sus datos de entrenamiento (por ejemplo, de Shutterstock), apostando a que insumos de alta calidad y obtenidos legalmente producen mejores resultados y brindan una base de confianza para los clientes empresariales.

  • El futuro de la contratación: Los agentes de video interactivos impulsados por IA podrían hacer que la contratación sea más justa al permitir que los candidatos demuestren sus habilidades mediante un caso práctico en vivo con una IA, superando los sesgos del filtrado de currículums y dando una oportunidad más equitativa a aspirantes de trayectorias no tradicionales.


Conclusiones prácticas



  • Empieza por sustituir documentos internos: Para obtener resultados rápidos, revisa las presentaciones de PowerPoint, las páginas wiki y los materiales de formación basados en texto de tu organización. Convertirlos en videos guiados por avatares puede aumentar la participación asíncrona y la retención.

  • Evita el error del “anuncio del Super Bowl”: El error de principiante es ser demasiado ambicioso e intentar crear campañas publicitarias insignia con la tecnología actual de avatares. En su lugar, céntrate en comunicaciones prácticas y de gran volumen donde se valore la autenticidad, pero los presupuestos de producción sean bajos.

  • Prioriza la autenticidad vocal: Si vas a crear un avatar personal, asegúrate de proporcionar muestras de voz de alta calidad. El realismo del avatar depende tanto de que suene como tú —hasta en tu acento específico— como de la fidelidad visual.

  • Usa la IA para ampliar, no reemplazar, la interacción humana: Considera utilizar videos personalizados con avatares para puntos de contacto escalables y uno a uno (como dar la bienvenida a nuevos suscriptores de un boletín), liberando tu tiempo real para conexiones humanas más profundas y auténticas donde más importan.

  • Cultiva la creatividad y el pensamiento crítico: A medida que la IA asuma más tareas de ejecución, las habilidades más preparadas para el futuro serán las capacidades humanas de concebir ideas originales, hacer las preguntas correctas y evaluar críticamente la información; habilidades que definen qué vale la pena construir en primer lugar.


Imagine ter um clone digital que consegue falar 140 idiomas, enquanto o seu eu real está limitado a apenas três. Essa foi a realidade que Maria Garib enfrentou quando se deparou com seu próprio avatar de IA criado pela Synthesia — um momento que encapsula perfeitamente os avanços ao mesmo tempo surreais e práticos da mídia sintética. Nesta conversa com o CEO da Synthesia, Victor Rappavalli, a discussão vai além de simples gêmeos digitais para explorar como a IA está remodelando fundamentalmente a comunicação, o aprendizado e os fluxos de trabalho empresariais, ao tornar a produção de vídeo tão fácil quanto criar um slide no PowerPoint.


A tese central é que a IA está levando o custo marginal da produção de vídeo — em termos de dinheiro, tempo e habilidade — em direção a zero, de forma semelhante a como os computadores pessoais democratizaram a escrita. Isso não se trata apenas de criar clipes de marketing; trata-se de substituir camadas inteiras da comunicação interna das empresas. Rappavalli vislumbra um futuro em que documentos estáticos, manuais de treinamento e memorandos internos sejam substituídos por vídeos dinâmicos e personalizados. Mais do que isso, o próprio vídeo está evoluindo de um meio passivo de transmissão para um “agente” interativo com o qual se pode conversar, como um módulo de treinamento que se transforma em um coach de vendas para simulações ou um tutorial que responde às suas perguntas de acompanhamento em tempo real.


Para as empresas hoje, o impacto mais imediato está na “camada intermediária” da comunicação. A Synthesia vê sua tecnologia ainda não como algo voltado para anúncios com padrão de Hollywood, mas para a enorme quantidade de treinamentos internos, explicações de produtos e processos de onboarding de clientes que atualmente existem como slides ou textos facilmente esquecíveis. Empresas como UBS e Heineken já estão usando vídeos com avatares para comunicar análises complexas e treinamentos de forma mais eficaz, obtendo ganhos significativos em engajamento e velocidade. O princípio orientador é “utilidade acima da novidade”, com foco em ROI real na redução de custos, criação mais rápida de conteúdo e melhor retenção de informação, em vez de projetos chamativos e experimentais.


Insights Surpreendentes



  • O caso de uso mais específico: Um dos primeiros adotantes foi uma barbearia no Brasil, que usou a plataforma para criar vídeos mostrando diferentes estilos de corte de cabelo para sua página no Facebook, demonstrando o alcance da tecnologia muito além dos casos de uso corporativos.

  • O papel crítico do sotaque: Uma grande barreira para a adoção de avatares não é apenas o “vale da estranheza” visual, mas a dissonância vocal. As pessoas são altamente sensíveis ao fato de seu clone digital ter o sotaque regional errado, razão pela qual a Synthesia desenvolveu seu próprio modelo de voz especificamente projetado para preservar nuances vocais.

  • Uma defesa de tempos de atenção mais curtos: Rappavalli questiona a narrativa de que a redução da capacidade de atenção se deve apenas à “podridão cerebral”. Ele sugere que isso pode ser uma resposta racional à abundância de conteúdo, em que o público naturalmente gravita em direção ao formato mais eficiente e envolvente — como um vídeo bem produzido em vez de um livro denso de 250 páginas — forçando o conteúdo a ser melhor.

  • Dados licenciados como diferencial: Ao contrário de muitas empresas de IA generativa, a Synthesia licencia proativamente dados de treinamento (por exemplo, da Shutterstock), apostando que insumos de alta qualidade e obtidos legalmente levam a resultados superiores e fornecem uma base de confiança para clientes corporativos.

  • O futuro das contratações: Agentes interativos de vídeo com IA podem tornar a contratação mais justa ao permitir que candidatos demonstrem habilidades por meio de um estudo de caso ao vivo com uma IA, indo além dos vieses da triagem de currículos e oferecendo uma oportunidade mais equitativa a candidatos de origens não tradicionais.


Aplicações Práticas



  • Comece substituindo documentos internos: Para obter ganhos rápidos, observe os decks de PowerPoint, páginas de wiki e materiais de treinamento baseados em texto na sua organização. Convertê-los em vídeos apresentados por avatares pode aumentar o engajamento assíncrono e a retenção.

  • Evite o erro do “anúncio do Super Bowl”: O erro típico de iniciantes é ser ambicioso demais e tentar criar campanhas publicitárias de destaque com a tecnologia atual de avatares. Em vez disso, concentre-se em comunicações práticas e de alto volume, nas quais a autenticidade é valorizada, mas os orçamentos de produção são baixos.

  • Priorize a autenticidade vocal: Se for criar um avatar pessoal, certifique-se de fornecer amostras de voz de alta qualidade. O realismo do avatar depende tanto de soar como você — até no seu sotaque específico — quanto da fidelidade visual.

  • Use a IA para expandir, não substituir, a interação humana: Considere usar vídeos personalizados com avatares para pontos de contato escaláveis e individuais (como dar boas-vindas a novos assinantes de uma newsletter), liberando seu tempo real para conexões humanas mais profundas, onde elas importam mais.

  • Cultive criatividade e pensamento crítico: À medida que a IA assume mais da execução, as habilidades mais resistentes ao futuro serão as capacidades humanas de conceber ideias originais, fazer as perguntas certas e avaliar criticamente informações — habilidades que definem o que vale a pena construir em primeiro lugar.


Get our AI Video Guide: https://clickhubspot.com/rhj

Episode 91: How far has AI video really come—and what happens when your digital self can work, teach, or sell for you? Matt Wolfe (https://x.com/mreflow) and Maria Gharib (https://uk.linkedin.com/in/maria-gharib-091779b9) sit down with Victor Riparbelli (https://x.com/vriparbelli), CEO and co-founder of Synthesia, the company leading the charge in AI-generated avatars that can communicate in over 140 languages.

Victor’s background includes pioneering research in AI video, growing Synthesia since 2017 to become an industry leader in lifelike, customizable avatars used for everything from business training to personalized marketing at scale.

This episode dives deep into what the rise of AI video agents means for the business world, what it takes to create realistic digital avatars (hint: it’s all about the body language), and how lowering the cost and complexity of video creation is changing internal communication and customer engagement. Plus, hear Synthesia’s ethical approach to deepfakes, licensing data, and critical business use cases that work right now (and not just as novelty). If you’ve ever wondered how close we are to having your AI twin closing deals or teaching your kids, this is the one to check out.

Check out The Next Wave YouTube Channel if you want to see Matt and Nathan on screen: https://lnk.to/thenextwavepd

Show Notes:

  • (00:00) AI Avatar and Future Video

  • (03:54) AI-Driven Interactive Video Evolution

  • (07:45) Corporate Shift to Video Communication

  • (11:42) AI Improving Digital Human Realism

  • (13:12) Accent Preservation in Voice Technology

  • (16:41) Video to Replace PowerPoints

  • (20:11) Balancing Content Moderation Challenges

  • (22:50) Regulating AI Outputs, Not Inputs

  • (26:36) Conversational Learning Revolution

  • (29:56) Future of AI-Powered Video Creation

Mentions:

Get the guide to build your own Custom GPT: https://clickhubspot.com/tnw

Check Out Matt’s Stuff:

• Future Tools – https://futuretools.beehiiv.com/

• Blog – https://www.mattwolfe.com/

• YouTube- https://www.youtube.com/@mreflow

Check Out Nathan’s Stuff:

The Next Wave is a HubSpot Original Podcast // Brought to you by Hubspot Media // Production by Darren Clarke // Editing by Ezra Bakker Trupiano

Leave a Reply

The Next Wave - AI and The Future of TechnologyThe Next Wave - AI and The Future of Technology
Let's Evolve Together
Logo