Summary & Insights
Imagine being able to generate a slick, animated explainer video with a coherent narrative and a consistent visual style just by feeding an AI some articles—a task that, just a few years ago, would have required a team of editors and motion designers. That’s the staggering leap demonstrated by the latest update to Notebook LM, which now produces cinematic-quality videos, signaling just how rapidly AI is closing the gap between amateur experimentation and professional-grade media creation. This breakthrough sits at the heart of a week packed with AI evolution, from subtle but meaningful refinements in how chatbots communicate to significant corporate drama and ethical controversies.
The conversation delves into the flurry of new AI model releases, demystifying the often-confusing version numbers. The hosts explain that updates like OpenAI’s GPT-5.3 Instant and GPT-5.4 represent different layers of post-training refinement rather than ground-up rebuilds. GPT-5.3 Instant is tuned to be “less cringe”—cutting the overly cautious and verbose preambles to deliver more direct answers. In contrast, GPT-5.4 is engineered more for developers and autonomous agents, boasting a massive one-million-token context window and native computer-use capabilities, allowing it to operate software on a user’s behalf. Meanwhile, Google’s Gemini 3.1 Flash is positioned as a cost-effective “workhorse” for tasks like image analysis within applications, highlighting a strategic segmentation of models for speed, depth, or affordability.
Beyond the technical specs, the discussion captures the intense cultural and political currents shaping the AI landscape. The ongoing saga between Anthropic (maker of Claude) and the Pentagon, which led to a public blacklisting of the company, triggered a notable consumer backlash against OpenAI and a surge in migrations to Claude. In Hollywood, the revelation of Ben Affleck’s AI company, Interpositive, and its acquisition by Netflix reveals an industry cautiously embracing AI for post-production efficiency—though not without a whiff of hypocrisy, as the tool seems designed to safeguard acting jobs while potentially displacing countless others in visual effects and editing. The week closes on a sobering note about privacy, as Meta faces lawsuits over human contractors reportedly reviewing intimate, unblurred footage from users’ smart glasses.
Surprising Insights
- The “Vibes Update”: A major release from OpenAI (GPT-5.3 Instant) wasn’t about getting smarter but about getting less annoying, specifically trained to reduce moralizing preambles and overly defensive language in its responses.
- Model “Distillation” for Speed: Models like Gemini 3.1 Flash are often created not by training on the entire internet anew, but through “distillation”—training a smaller, faster model on the input/output pairs and chain-of-thought from a larger model, making it cheaper and quicker while retaining similar capabilities.
- Selective Hollywood Adoption: The AI tool embraced by Netflix and Ben Affleck is framed not as a replacement for human creativity but as a means to protect it, allowing actors to focus on performance while AI handles technical post-production tasks—a stance that overlooks the potential impact on many other filmmaking professions.
- The Token-Saving Agent: OpenAI’s new “tool search” feature for GPT-5.4 doesn’t load descriptions of all available tools into the context window by default. Instead, it searches for the right tool when needed, significantly conserving tokens and cost, which is critical for running efficient, long-lived AI agents.
- Human-Powered AI Training: Despite advanced blurring promises, human reviewers at an overseas contractor were reportedly viewing unblurred, private footage from Meta’s smart glasses—including people in bathrooms—to annotate data for AI training, highlighting the messy human labor behind “automated” systems.
Practical Takeaways
- Choose Your Model by Task: For quick, direct answers, use GPT-5.3 Instant. For complex coding or agentic tasks needing deep context, leverage GPT-5.4. For cost-effective, high-volume tasks within your own apps (like image analysis), consider Gemini 3.1 Flash.
- Leverage AI for Video Prototyping: Use tools like Notebook LM’s cinematic video generation (available on higher-tier plans) to rapidly create animated explainer videos or to generate visual assets and b-roll that can be incorporated into your professional edits.
- Audit Your Smart Device Privacy: If you use devices like Meta smart glasses or AI wearables, proactively dive into the privacy settings to disable any data-sharing or cloud review features you’re uncomfortable with; don’t assume the default settings protect your privacy.
- Simplify Code with Fast, Cheap Models: When building applications that require simple AI functions (e.g., describing an uploaded image, moderating content), integrate smaller, distilled models like Gemini Flash to keep costs low and performance fast, saving your budget for more complex model calls elsewhere.
- Utilize System Instructions for Tone: While newer models are being trained to be less verbose, you can further shape outputs by using system instructions or custom instructions in your chats (e.g., “be concise and do not use preambles”) to steer the model’s conversational style.
Hãy tưởng tượng bạn có thể tạo ra một video giải thích hoạt hình mượt mà, với câu chuyện mạch lạc và phong cách hình ảnh nhất quán, chỉ bằng cách đưa cho AI một vài bài báo—một nhiệm vụ mà vài năm trước cần cả một đội ngũ biên tập viên và nhà thiết kế chuyển động. Đó là bước nhảy vọt đáng kinh ngạc mà bản cập nhật mới nhất của Notebook LM đã thể hiện, khi giờ đây nó có thể tạo ra những video chất lượng điện ảnh, cho thấy tốc độ AI đang thu hẹp khoảng cách giữa thử nghiệm nghiệp dư và sản xuất nội dung chuyên nghiệp một cách nhanh chóng. Đột phá này nằm ở trung tâm của một tuần đầy ắp sự phát triển của AI, từ những cải tiến tinh tế nhưng ý nghĩa trong cách chatbot giao tiếp cho đến những biến động doanh nghiệp lớn và các tranh cãi đạo đức.
Cuộc thảo luận đi sâu vào hàng loạt mô hình AI mới được phát hành, giải mã những số phiên bản thường gây bối rối. Các chuyên gia giải thích rằng các bản cập nhật như GPT-5.3 Instant và GPT-5.4 của OpenAI đại diện cho các lớp tinh chỉnh sau đào tạo khác nhau chứ không phải là các phiên bản xây dựng lại từ đầu. GPT-5.3 Instant được điều chỉnh để “ít gượng gạo hơn”—cắt bỏ những phần mở đầu quá thận trọng và dài dòng để đưa ra câu trả lời trực tiếp hơn. Ngược lại, GPT-5.4 được thiết kế nhiều hơn cho các nhà phát triển và tác nhân tự động, sở hữu cửa sổ ngữ cảnh khổng lồ lên tới một triệu token và khả năng sử dụng máy tính gốc, cho phép nó vận hành phần mềm thay mặt người dùng. Trong khi đó, Gemini 3.1 Flash của Google được định vị như một “cỗ máy làm việc” tiết kiệm chi phí cho các tác vụ như phân tích hình ảnh trong ứng dụng, làm nổi bật sự phân khúc chiến lược các mô hình để đạt tốc độ, độ sâu hoặc tính kinh tế.
Vượt ra ngoài thông số kỹ thuật, cuộc thảo luận nắm bắt những dòng chảy văn hóa và chính trị mãnh liệt đang định hình bối cảnh AI. Diễn biến kéo dài giữa Anthropic (nhà tạo ra Claude) và Lầu Năm Góc, dẫn đến việc công ty này bị đưa vào danh sách đen công khai, đã kích hoạt một làn sóng phản đối đáng chú ý từ người dùng nhắm vào OpenAI và một đợt di cư ồ ạt sang Claude. Tại Hollywood, việc tiết lộ công ty AI của Ben Affleck, Interpositive, và việc Netflix mua lại nó cho thấy một ngành công nghiệp đang thận trọng chấp nhận AI để nâng cao hiệu quả hậu kỳ—dù không thiếu vẻ đạo đức giả, khi công cụ dường như được thiết kế để bảo vệ công việc diễn xuất trong khi có nguy cơ thay thế vô số công việc khác trong lĩnh vực hiệu ứng hình ảnh và biên tập. Tuần này khép lại với một nốt trầm đáng suy ngẫm về quyền riêng tư, khi Meta phải đối mặt với các vụ kiện vì các nhà thầu con người được cho là đã xem xét cảnh quay riêng tư, không được làm mờ từ kính thông minh của người dùng.
Những Thông Tin Đáng Ngạc Nhiên
- Bản Cập Nhật “Cảm Tính”: Một bản phát hành lớn từ OpenAI (GPT-5.3 Instant) không nhằm mục đích thông minh hơn mà để bớt phiền phức hơn, được đào tạo đặc biệt để giảm bớt những lời mở đầu mang tính đạo đức và ngôn ngữ phòng thủ quá mức trong phản hồi.
- “Chưng cất” Mô hình để Tăng Tốc: Các mô hình như Gemini 3.1 Flash thường không được tạo ra bằng cách đào tạo lại toàn bộ internet, mà thông qua “chưng cất”—đào tạo một mô hình nhỏ hơn, nhanh hơn dựa trên các cặp đầu vào/đầu ra và chuỗi suy luận từ một mô hình lớn hơn, giúp nó rẻ hơn và nhanh hơn trong khi vẫn giữ được các khả năng tương tự.
- Tiếp nhận Có Chọn lọc ở Hollywood: Công cụ AI được Netflix và Ben Affleck chấp nhận được định khung không phải để thay thế sự sáng tạo của con người mà như một phương tiện để bảo vệ nó, cho phép diễn viên tập trung vào biểu diễn trong khi AI xử lý các tác vụ kỹ thuật hậu kỳ—một lập trường bỏ qua tác động tiềm tàng đối với nhiều ngành nghề làm phim khác.
- Tác Nhân Tiết kiệm Token: Tính năng “tìm kiếm công cụ” mới của OpenAI dành cho GPT-5.4 không tải mô tả của tất cả công cụ có sẵn vào cửa sổ ngữ cảnh theo mặc định. Thay vào đó, nó tìm kiếm công cụ phù hợp khi cần, giúp tiết kiệm đáng kể token và chi phí, điều quan trọng để vận hành các tác nhân AI hiệu quả, lâu dài.
- Đào tạo AI bằng Sức người: Bất chấp những cam kết làm mờ tiên tiến, các nhà đánh giá con người tại một nhà thầu nước ngoài được cho là đã xem cảnh quay riêng tư, không được làm mờ từ kính thông minh của Meta—bao gồm cả người trong phòng tắm—để chú thích dữ liệu cho việc đào tạo AI, làm nổi bật sức lao động con người phức tạp đằng sau các hệ thống “tự động”.
Những Điểm Rút ra Thực tiễn
- Chọn Mô hình theo Tác vụ: Để có câu trả lời nhanh, trực tiếp, hãy dùng GPT-5.3 Instant. Để viết mã phức tạp hoặc các tác vụ tự động cần ngữ cảnh sâu, hãy tận dụng GPT-5.4. Đối với các tác vụ khối lượng lớn, hiệu quả về chi phí trong ứng dụng của bạn (như phân tích hình ảnh), hãy cân nhắc Gemini 3.1 Flash.
- Tận dụng AI để Tạo Nguyên mẫu Video: Sử dụng các công cụ như tính năng tạo video điện ảnh của Notebook LM (có sẵn ở các gói cao cấp hơn) để nhanh chóng tạo video giải thích hoạt hình hoặc tạo nội dung tài sản hình ảnh và cảnh quay phụ có thể tích hợp vào các bản chỉnh sửa chuyên nghiệp của bạn.
- Kiểm tra Quyền riêng tư Thiết bị Thông minh: Nếu bạn sử dụng các thiết bị như kính thông minh Meta hoặc đồ đeo AI, hãy chủ động tìm hiểu kỹ cài đặt quyền riêng tư để tắt bất kỳ tính năng chia sẻ dữ liệu hoặc xem xét trên đám mây nào mà bạn cảm thấy không thoải mái; đừng cho rằng cài đặt mặc định bảo vệ quyền riêng tư của bạn.
- Đơn giản hóa Mã với Mô hình Nhanh, Rẻ: Khi xây dựng ứng dụng yêu cầu các chức năng AI đơn giản (ví dụ: mô tả hình ảnh được tải lên, kiểm duyệt nội dung), hãy tích hợp các mô hình nhỏ, đã chưng cất như Gemini Flash để giữ chi phí thấp và hiệu suất nhanh, dành ngân sách cho các lệnh gọi mô hình phức tạp hơn ở nơi khác.
- Sử dụng Hướng dẫn Hệ thống để Điều chỉnh Sắc thái: Trong khi các mô hình mới hơn đang được đào tạo để bớt dài dòng, bạn có thể định hình đầu ra hơn nữa bằng cách sử dụng hướng dẫn hệ thống hoặc hướng dẫn tùy chỉnh trong cuộc trò chuyện (ví dụ: “hãy ngắn gọn và không sử dụng phần mở đầu”) để định hướng phong cách hội thoại của mô hình.
試想,僅需將幾篇文章輸入人工智慧,便能生成一部畫面流暢、敘事連貫、視覺風格統一的動態解說影片——這項任務在幾年前仍需一支編輯與動態設計師團隊才能完成。這正是Notebook LM最新版本所展現的驚人躍進:該工具如今能製作出電影級品質的影片,顯示AI正以何等速度縮短業餘實驗與專業級媒體創作之間的距離。本週AI領域進展密集,從聊天機器人溝通方式的細膩優化,到重大的企業動盪與倫理爭議,而這項突破正處於這場演變的核心。
對話深入探討近期密集釋出的新AI模型,釐清常令人困惑的版本編號意義。主持人解釋,如OpenAI的GPT-5.3 Instant與GPT-5.4這類更新,實質代表訓練後優化的不同層次,而非從頭重建的版本。GPT-5.3 Instant被調整為「減少尷尬感」——刪除過度謹慎與冗長的開場白,以提供更直接的答案。相對地,GPT-5.4則更針對開發者與自主代理程式設計,具備高達百萬詞元的上下文窗口與原生電腦操作能力,可代表使用者運行軟體。與此同時,Google的Gemini 3.1 Flash則被定位為具成本效益的「主力模型」,專注於應用程式內的圖像分析等任務,凸顯出AI模型依速度、深度或經濟性進行策略性分級的趨勢。
除了技術規格外,討論亦捕捉到形塑AI領域的強烈文化與政治潮流。Anthropic(Claude開發商)與五角大廈間的持續紛爭,導致該公司遭公開抵制,進而引發消費者對OpenAI的顯著反彈,以及大量用戶轉向Claude的遷徙潮。在好萊塢,班·艾佛列克的AI公司Interpositive及其被Netflix收購的消息,顯示影視產業正謹慎地採用AI以提升後製效率——儘管不免帶有一絲虛偽,因為該工具看似旨在保障演員工作,卻可能取代視覺特效與剪輯等無數其他職位。本週以隱私議題的嚴峻提醒作結:Meta因據傳有海外人力承包商檢視用戶智慧眼鏡未經模糊處理的私密影像(包括浴室畫面)以標註AI訓練數據,而面臨訴訟。
驚人洞見
- 「氛圍更新」: OpenAI的重大版本(GPT-5.3 Instant)重點不在變得更聰明,而在變得更不惱人——其經過專門訓練,以減少回答中說教式的開場白與過度防禦性的語言。
- 為速度而生的模型「蒸餾」:如Gemini 3.1 Flash等模型,常非透過重新訓練整個網路數據產生,而是藉由「蒸餾」——以大型模型的輸入/輸出配對及思維鏈訓練更小、更快的模型,從而降低成本與提升速度,同時保留相近能力。
- 好萊塢的選擇性接納: Netflix與班·艾佛列克採用的AI工具,被定位為保護人類創意而非取代之的手段,讓演員專注表演,而AI處理技術性後製任務——此立場忽視了對電影產業其他工種的潛在衝擊。
- 節省詞元的代理程式: OpenAI為GPT-5.4推出的新「工具搜尋」功能,預設不會將所有可用工具的描述載入上下文窗口,而是在需要時搜尋合適工具,大幅節省詞元與成本,對運行高效、長期的AI代理程式至關重要。
- 人力驅動的AI訓練:儘管有先進模糊化技術的承諾,海外承包商的人力審核員據報仍檢視Meta智慧眼鏡未經模糊處理的私人影像(包括浴室中的人物)以標註AI訓練數據,揭露「自動化」系統背後混亂的人力勞動現實。
實用要點
- 依任務選擇模型:需快速直接答案時,使用GPT-5.3 Instant。需複雜編碼或深層上下文之代理任務時,選用GPT-5.4。若需在自有應用中執行經濟高效的大量任務(如圖像分析),可考慮Gemini 3.1 Flash。
- 運用AI進行影片原型設計:利用如Notebook LM的電影級影片生成功能(高階方案可用),快速創作動態解說影片,或生成可整合至專業剪輯中的視覺素材與輔助畫面。
- 審查智慧裝置隱私設定:若使用Meta智慧眼鏡或AI穿戴裝置,應主動檢視隱私設定,停用任何令你不安的數據共享或雲端檢閱功能;切勿預設原始設定能保護隱私。
- 以快速經濟模型簡化編碼:開發需簡易AI功能(如描述上傳圖像、內容審核)的應用時,整合Gemini Flash等經蒸餾的小型模型以維持低成本與高效能,將預算保留給其他更複雜的模型調用。
- 利用系統指令調整語氣:雖新模型已訓練為較不冗長,仍可透過對話中的系統指令或自訂指令(如「簡明扼要,勿用開場白」)進一步塑造輸出,引導模型的對話風格。
Imagine poder generar un video explicativo elegante y animado, con una narrativa coherente y un estilo visual consistente, simplemente proporcionándole a una IA algunos artículos; una tarea que, hace apenas unos años, habría requerido un equipo de editores y diseñadores de motion graphics. Ese es el asombroso salto que demuestra la última actualización de Notebook LM, que ahora produce videos de calidad cinematográfica, lo que deja claro con qué rapidez la IA está cerrando la brecha entre la experimentación amateur y la creación de medios de nivel profesional. Este avance está en el centro de una semana cargada de evolución en la IA, desde refinamientos sutiles pero significativos en la forma en que se comunican los chatbots hasta importantes dramas corporativos y controversias éticas.
La conversación profundiza en la avalancha de nuevos lanzamientos de modelos de IA, desmitificando sus números de versión, a menudo confusos. Los presentadores explican que actualizaciones como GPT-5.3 Instant y GPT-5.4 de OpenAI representan diferentes capas de refinamiento posterior al entrenamiento, más que reconstrucciones desde cero. GPT-5.3 Instant está ajustado para ser “menos vergonzoso” o incómodo, eliminando preámbulos excesivamente cautelosos y verbosos para ofrecer respuestas más directas. En cambio, GPT-5.4 está diseñado más para desarrolladores y agentes autónomos, con una enorme ventana de contexto de un millón de tokens y capacidades nativas de uso de computadora, lo que le permite operar software en nombre del usuario. Mientras tanto, Gemini 3.1 Flash de Google se posiciona como una opción rentable y todoterreno para tareas como el análisis de imágenes dentro de aplicaciones, destacando una segmentación estratégica de modelos según velocidad, profundidad o asequibilidad.
Más allá de las especificaciones técnicas, la discusión recoge las intensas corrientes culturales y políticas que están moldeando el panorama de la IA. La saga en curso entre Anthropic (creadora de Claude) y el Pentágono, que llevó a una exclusión pública de la empresa, provocó una notable reacción negativa de los consumidores contra OpenAI y un aumento en la migración hacia Claude. En Hollywood, la revelación de la empresa de IA de Ben Affleck, Interpositive, y su adquisición por parte de Netflix muestra a una industria que adopta cautelosamente la IA para ganar eficiencia en la posproducción, aunque no sin cierto aire de hipocresía, ya que la herramienta parece diseñada para proteger los empleos actorales mientras potencialmente desplaza a muchos otros en efectos visuales y edición. La semana termina con una nota preocupante sobre privacidad, mientras Meta enfrenta demandas por informes de que contratistas humanos revisaron imágenes íntimas y sin difuminar provenientes de las gafas inteligentes de los usuarios.
Ideas sorprendentes
- La “actualización de vibra”: Un lanzamiento importante de OpenAI (GPT-5.3 Instant) no buscaba ser más inteligente, sino menos molesto, entrenado específicamente para reducir preámbulos moralizantes y lenguaje excesivamente defensivo en sus respuestas.
- La “destilación” de modelos para ganar velocidad: Modelos como Gemini 3.1 Flash a menudo no se crean entrenándolos de nuevo con todo internet, sino mediante “destilación”: entrenando un modelo más pequeño y rápido a partir de pares de entrada/salida y cadenas de razonamiento de un modelo más grande, lo que lo hace más barato y veloz mientras conserva capacidades similares.
- Adopción selectiva en Hollywood: La herramienta de IA adoptada por Netflix y Ben Affleck no se presenta como un reemplazo de la creatividad humana, sino como un medio para protegerla, permitiendo que los actores se concentren en su interpretación mientras la IA se encarga de tareas técnicas de posproducción; una postura que pasa por alto el posible impacto en muchas otras profesiones cinematográficas.
- El agente que ahorra tokens: La nueva función de “búsqueda de herramientas” de OpenAI para GPT-5.4 no carga por defecto en la ventana de contexto las descripciones de todas las herramientas disponibles. En su lugar, busca la herramienta adecuada cuando la necesita, lo que ahorra significativamente tokens y costos, algo fundamental para ejecutar agentes de IA eficientes y de larga duración.
- Entrenamiento de IA impulsado por humanos: A pesar de las avanzadas promesas de difuminado, se informó que revisores humanos de un contratista en el extranjero estaban viendo imágenes privadas sin difuminar de las gafas inteligentes de Meta —incluyendo personas en baños— para anotar datos destinados al entrenamiento de IA, lo que pone de relieve el desordenado trabajo humano detrás de los sistemas “automatizados”.
Conclusiones prácticas
- Elige el modelo según la tarea: Para respuestas rápidas y directas, usa GPT-5.3 Instant. Para tareas complejas de programación o agentes que requieran contexto profundo, aprovecha GPT-5.4. Para tareas rentables y de gran volumen dentro de tus propias aplicaciones (como análisis de imágenes), considera Gemini 3.1 Flash.
- Aprovecha la IA para prototipos de video: Usa herramientas como la generación de video cinematográfico de Notebook LM (disponible en planes superiores) para crear rápidamente videos explicativos animados o generar recursos visuales y material de apoyo que puedas incorporar en tus ediciones profesionales.
- Revisa la privacidad de tus dispositivos inteligentes: Si usas dispositivos como las gafas inteligentes de Meta o wearables con IA, revisa de forma proactiva la configuración de privacidad para desactivar cualquier función de intercambio de datos o revisión en la nube con la que no te sientas cómodo; no asumas que la configuración predeterminada protege tu privacidad.
- Simplifica el código con modelos rápidos y baratos: Al desarrollar aplicaciones que requieran funciones sencillas de IA (por ejemplo, describir una imagen subida o moderar contenido), integra modelos más pequeños y destilados como Gemini Flash para mantener bajos los costos y alto el rendimiento, reservando tu presupuesto para llamadas a modelos más complejos en otras partes.
- Usa instrucciones del sistema para definir el tono: Aunque los modelos más nuevos están siendo entrenados para ser menos verbosos, puedes moldear aún más sus respuestas usando instrucciones del sistema o instrucciones personalizadas en tus chats (por ejemplo, “sé conciso y no uses preámbulos”) para orientar su estilo conversacional.
Imagine poder gerar um vídeo explicativo sofisticado e animado, com uma narrativa coerente e um estilo visual consistente, apenas fornecendo alguns artigos a uma IA — uma tarefa que, há poucos anos, teria exigido uma equipe de editores e designers de motion. Esse é o salto impressionante demonstrado pela atualização mais recente do Notebook LM, que agora produz vídeos com qualidade cinematográfica, sinalizando o quão rapidamente a IA está reduzindo a distância entre a experimentação amadora e a criação de mídia em nível profissional. Esse avanço está no centro de uma semana repleta de evolução em IA, desde refinamentos sutis, mas significativos, na forma como os chatbots se comunicam até grandes dramas corporativos e controvérsias éticas.
A conversa explora a enxurrada de lançamentos de novos modelos de IA, desmistificando os números de versão frequentemente confusos. Os apresentadores explicam que atualizações como o GPT-5.3 Instant e o GPT-5.4 da OpenAI representam diferentes camadas de refinamento pós-treinamento, e não reconstruções feitas do zero. O GPT-5.3 Instant foi ajustado para ser “menos constrangedor” — eliminando introduções excessivamente cautelosas e prolixas para entregar respostas mais diretas. Em contraste, o GPT-5.4 foi projetado mais para desenvolvedores e agentes autônomos, ostentando uma enorme janela de contexto de um milhão de tokens e capacidades nativas de uso do computador, permitindo que opere softwares em nome do usuário. Enquanto isso, o Gemini 3.1 Flash, do Google, é posicionado como um “cavalo de batalha” econômico para tarefas como análise de imagens em aplicativos, destacando uma segmentação estratégica de modelos por velocidade, profundidade ou custo.
Além das especificações técnicas, a discussão captura as intensas correntes culturais e políticas que moldam o cenário da IA. A saga em andamento entre a Anthropic (criadora do Claude) e o Pentágono, que levou a uma exclusão pública da empresa, desencadeou uma reação negativa notável dos consumidores contra a OpenAI e uma onda de migração para o Claude. Em Hollywood, a revelação da empresa de IA de Ben Affleck, a Interpositive, e sua aquisição pela Netflix mostram uma indústria abraçando cautelosamente a IA para obter eficiência na pós-produção — embora não sem um certo cheiro de hipocrisia, já que a ferramenta parece ter sido projetada para proteger empregos de atores, ao mesmo tempo em que pode deslocar inúmeros outros profissionais de efeitos visuais e edição. A semana termina em um tom preocupante sobre privacidade, com a Meta enfrentando processos por supostamente permitir que contratados humanos revisassem imagens íntimas e sem desfoque captadas pelos óculos inteligentes de usuários.
Percepções Surpreendentes
- A “Atualização de Vibe”: Um grande lançamento da OpenAI (GPT-5.3 Instant) não teve como foco ficar mais inteligente, mas sim ficar menos irritante, sendo treinado especificamente para reduzir introduções moralizantes e linguagem excessivamente defensiva em suas respostas.
- “Destilação” de Modelos para Velocidade: Modelos como o Gemini 3.1 Flash muitas vezes não são criados por meio de um novo treinamento em toda a internet, mas sim por “destilação” — treinando um modelo menor e mais rápido com pares de entrada/saída e cadeias de raciocínio de um modelo maior, tornando-o mais barato e ágil, enquanto mantém capacidades semelhantes.
- Adoção Seletiva em Hollywood: A ferramenta de IA adotada pela Netflix e por Ben Affleck é apresentada não como substituta da criatividade humana, mas como um meio de protegê-la, permitindo que atores foquem na atuação enquanto a IA cuida de tarefas técnicas de pós-produção — uma posição que ignora o impacto potencial sobre muitas outras profissões do cinema.
- O Agente que Economiza Tokens: O novo recurso de “busca de ferramentas” da OpenAI para o GPT-5.4 não carrega por padrão as descrições de todas as ferramentas disponíveis na janela de contexto. Em vez disso, ele procura a ferramenta certa quando necessário, economizando significativamente tokens e custos, algo essencial para operar agentes de IA eficientes e de longa duração.
- Treinamento de IA Movido por Humanos: Apesar das promessas de desfoque avançado, revisores humanos de uma empresa terceirizada no exterior estariam visualizando imagens privadas e sem desfoque vindas dos óculos inteligentes da Meta — incluindo pessoas em banheiros — para anotar dados de treinamento de IA, destacando o trabalho humano confuso e invisível por trás de sistemas “automatizados”.
Conclusões Práticas
- Escolha Seu Modelo de Acordo com a Tarefa: Para respostas rápidas e diretas, use o GPT-5.3 Instant. Para tarefas complexas de programação ou tarefas agentivas que exijam contexto profundo, utilize o GPT-5.4. Para tarefas econômicas e de alto volume dentro de seus próprios aplicativos (como análise de imagens), considere o Gemini 3.1 Flash.
- Aproveite a IA para Prototipagem de Vídeo: Use ferramentas como a geração de vídeos cinematográficos do Notebook LM (disponível em planos mais avançados) para criar rapidamente vídeos explicativos animados ou gerar recursos visuais e b-roll que possam ser incorporados às suas edições profissionais.
- Audite a Privacidade dos Seus Dispositivos Inteligentes: Se você usa dispositivos como os óculos inteligentes da Meta ou wearables com IA, verifique proativamente as configurações de privacidade para desativar qualquer recurso de compartilhamento de dados ou revisão em nuvem com o qual não se sinta confortável; não presuma que as configurações padrão protegem sua privacidade.
- Simplifique Código com Modelos Rápidos e Baratos: Ao desenvolver aplicativos que exigem funções simples de IA (por exemplo, descrever uma imagem enviada, moderar conteúdo), integre modelos menores e destilados, como o Gemini Flash, para manter os custos baixos e o desempenho rápido, reservando seu orçamento para chamadas mais complexas a outros modelos.
- Use Instruções de Sistema para Ajustar o Tom: Embora os modelos mais novos estejam sendo treinados para ser menos prolixos, você pode moldar ainda mais os resultados usando instruções de sistema ou instruções personalizadas em suas conversas (por exemplo, “seja conciso e não use introduções”) para orientar o estilo conversacional do modelo.
Get my 20+ NotebookLM tricks: https://clickhubspot.com/ocmf
Episode 100: Is Google’s NotebookLM about to replace After Effects, and what’s really happening in the battle between ChatGPT and Anthropic’s Claude? Matt Wolfe (https://x.com/mreflow) and Joe Fier (https://www.youtube.com/@joefier) break it all down in this packed episode, exploring the latest in generative AI video, the war between LLMs, and why Hollywood legends like Ben Affleck are bringing AI into filmmaking.
This episode dives into the tsunami of new model releases from OpenAI, Google, and Anthropic—what’s new, what’s hype, and what it means for everyday creators and businesses. The hosts break down the surprising rise of Claude after a headline-making military contract dispute, explain how Claude made it ridiculously easy to jump ship from ChatGPT, and share behind-the-scenes looks at Google’s Ultra plan, the cinematic power of NotebookLM, and its impact on traditional After Effects work.
Check out The Next Wave YouTube Channel if you want to see Matt and Nathan on screen: https://lnk.to/thenextwavepd
—
Show Notes:
-
(00:00) NotebookLM AI Tool Insights
-
(06:57) Training AI: Steps Explained
-
(13:56) Distilled Models for Efficiency
-
(18:02) Million-Token Context for Coding
-
(22:51) Efficient Tool Search System
-
(28:31 Gemini 3.1 Flashlight Overview
-
(33:16) Thumbnail Analysis and Optimization
-
(41:37) Animating Videos with NotebookLM
-
(43:21) AI Video Generation Progress
-
(50:55) OpenAI’s Pentagon Deal Controversy
-
(56:13) Supply Chain Risks and War Talks
-
(01:02:11) Hollywood’s Tech Shift: Mixed Feelings
-
(01:05:28) Streaming’s Impact on Production Speed
-
(01:10:01) Meta Glasses Privacy Controversy
-
(01:13:40) Meta Sued Over Privacy Violations
—
Mentions:
-
Joe Fier: https://www.youtube.com/@joefier
-
NotebookLM: https://notebooklm.google/
-
After Effects: https://www.adobe.com/products/aftereffects.html
-
OpenClaw: https://openclaw.ai/
-
Manus: https://manus.im/
-
Nano Banana 2: https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/
-
Claude: https://claude.ai/
-
Gemini: https://gemini.google.com/app
-
Cursor: https://cursor.com/
Get the guide to build your own Custom GPT: https://clickhubspot.com/tnw
—
Check Out Matt’s Stuff:
• Future Tools – https://futuretools.beehiiv.com/
• Blog – https://www.mattwolfe.com/
• YouTube- https://www.youtube.com/@mreflow
—
Check Out Nathan’s Stuff:
-
Newsletter: https://news.lore.com/
-
Blog – https://lore.com/
The Next Wave is a HubSpot Original Podcast // Brought to you by Hubspot Media // Production by Darren Clarke // Editing by Ezra Bakker Trupiano

Leave a Reply
You must be logged in to post a comment.