Home Uncategorized Nano Banana 2 Lite: Google ra mắt trình tạo hình ảnh AI...

Nano Banana 2 Lite: Google ra mắt trình tạo hình ảnh AI rẻ hơn

2
0


Google mở rộng một loạt các mô hình tổng hợp của nó với Nano Banana 2 Lite, một trình tạo hình ảnh AI nhanh và rẻ tiền, và Gemini Omni Flash, một phiên bản dành riêng cho video đàm thoại. Google đang nhắm mục tiêu đến cả nhà phát triển và công chúng, đồng thời tìm cách thu hẹp khoảng cách với OpenAI trên bảng xếp hạng điểm chuẩn.

Nano Banana 2 Lite tập trung vào tốc độ và giá cả

Nano Banana 2 Lite tập trung đầu tiên vào hiệu quả. Mô hình, được liệt kê là gemini-3.1-flash-lite-image, tạo ra hình ảnh trong khoảng bốn giây và tính phí 0,034 USD cho hình ảnh có độ phân giải 1K. Định vị này làm cho nó trở thành một công cụ được thiết kế để sử dụng với số lượng lớn, trong đó thời gian phản hồi và chi phí cũng quan trọng như chất lượng thô.

Google ở ​​đây mở rộng một dòng sản phẩm đã có từ lâu, sau Nano Banana ban đầu, Nano Chuối Pro vào tháng 12 năm 2025 và Nano Chuối 2 vào tháng 2 năm 2026. Tính năng mới này có sẵn trong Google AI Studio, API Gemini và Nền tảng đại lý doanh nghiệp Gemini, nhưng cũng có trong Chế độ AI trên công cụ tìm kiếm Google (sớm ở Pháp), ứng dụng Gemini, NotebookLM, Google Photos, Stitch, Google Flow và Google Ads.

Trên bảng xếp hạng Arena, Nano Banana 2 Lite đứng thứ năm. Anh ấy ở lại phía sau Hình ảnh GPT 2.0 từ OpenAI, vẫn là số một, Reve 2.0, Nano Banana 2 và MAI Image 2.5 của Microsoft. Google vẫn chưa thống trị ngôi đầu bảng, nhưng họ đang tìm cách chuyển cuộc chiến sang một nền tảng cụ thể hơn: đó là tỷ lệ tốc độ-giá cả.

Gemini Omni Flash cho video

Google cũng đang tung ra bản xem trước Gemini Omni Flash, mẫu video đàm thoại đầu tiên có khả năng hoạt động từ văn bản, hình ảnh hoặc video. Dịch vụ này tính phí 0,10 USD mỗi giây, cùng mức giá với Veo 3.1 Fast, với giới hạn được đặt ở mức 10 giây cho mỗi video. Định dạng ngắn gọn này cho thấy Google hiện đang ưu tiên sử dụng nhanh chóng được tích hợp vào các giao diện sáng tạo.

Mô hình này cho phép bạn sửa đổi hoặc phát triển video bằng ngôn ngữ tự nhiên, với các tham chiếu đa phương thức và đồng bộ hóa giữa các yếu tố văn bản và đồ họa. Nó có sẵn để thử nghiệm trong Google AI Studio, Gemini API, Nền tảng đại lý doanh nghiệp Gemini, Ứng dụng Gemini và Google Flow. Do đó, Google đang chuẩn bị cho việc phân phối rộng rãi, vượt xa một công cụ đơn giản dành riêng cho người thử nghiệm.

Tuy nhiên, bản xem trước vẫn còn một số hạn chế về mặt kỹ thuật. Tham chiếu âm thanh không được hỗ trợ và tham chiếu video tối đa 3 giây được gửi qua API vẫn chưa được xử lý đúng cách. Những hạn chế này cho thấy Google đang phát triển nhanh chóng video sáng tạo AI, nhưng trên nền tảng vẫn chưa ổn định, nơi việc dân chủ hóa các công cụ đôi khi đi trước sự trưởng thành hoàn toàn của chúng.