Tuần trước OpenAI đã khiến nhiều người ngỡ ngàng trước mô hình AI mới công bố của họ. Được đặt tên Sora, mô hình AI này giúp người dùng dựng được các đoạn video ngắn chỉ bằng vài dòng mô tả bằng văn bản. Điều này cho phép người dùng có thể tùy ý sáng tạo ra các nội dung video theo ý muốn của mình mà không cần đến các dụng cụ quay phim chuyên nghiệp hay trình độ thiết kế, dựng phim, bối cảnh.
Điều đáng nói hơn cả là chất lượng của các đoạn video này thật đáng kinh ngạc. Chúng sống động và chân thực một cách đáng ngạc nhiên, ngay cả với những video có bối cảnh tương đối phức tạp, ví dụ như đoạn video về người phụ nữ đang bước đi trên đoạn phố với ánh đèn lấp láy phía sau dưới đây.
Ai tinh ý mới nhận ra lỗi chéo chân xuất hiện trong giây thứ 16 của clip này.
Cho dù đoạn video này vẫn còn một vài lỗi kỳ quặc như bước chân trái phải không đồng đều trong đoạn giữa video, nhưng thường phải ai đó tinh mắt lắm mới nhận ra. Ngoài ra, chuyển động của nhân vật và khung cảnh xung quanh đều chân thực đến mức khó tin, trông như một đoạn phim được dựng lên từ các máy quay và kỹ xảo cao cấp.
Với mức độ chân thực đáng kinh ngạc như trên, không khó hiểu tại sao mới chỉ có một nhóm nhỏ các chuyên gia về chống tin giả, các nội dung xuyên tạc với thiên vị được OpenAI cho phép truy cập công cụ này.
Các chuyên gia này – bao gồm cả CEO OpenAI, Sam Altman – đã không bỏ lỡ cơ hội hiếm có này để thể hiện khả năng sáng tạo của mình thông qua mô hình Sora mới. Thậm chí các đoạn video demo này còn có chất lượng cao hơn cả những gì được trình diễn trong thông báo ra mắt Sora của OpenAI.
Dưới đây là một số ví dụ được đăng tải trên nền tảng X.com của người dùng Proper cho thấy khả năng sản sinh video với chất lượng đáng kinh ngạc của mô hình AI này:
Một chú khỉ đánh cờ được thiết kế chi tiết đến mức các sợi lông trên thân ăn khớp với chuyển động của nó như thế nào
Cảnh vận động viên xe đạp đổ đèo trông giống như được quay bằng camera thật, chỉ có ai tinh ý mới nhận ra một lỗi nhỏ là các lối rẽ đột nhiên xuất hiện mỗi khi vận động viên đổi hướng
Cảnh 2 giọt nước đang nhảy múa với nhau do Sora tạo ra. Clip được đăng tải trên tài khoản của Tim Brooks, người dẫn dắt nhóm phát triển Sora tại OpenAI.
Clip biến hình từ tắc kè sang chim công do Tim Brooks đăng tải.
Một clip khác do Tim Brooks đăng tải. Dù chân thực đến mức như được quay trong thực tế, nhưng nếu nhìn kỹ có thể nhận ra cái vây của con cá mập vẫn chưa hoàn toàn chính xác
Một đoạn clip được CEO OpenAI, Sam Altman đăng tải trên tài khoản X của mình
Một clip khác được Sam Altman đăng tải trên tài khoản X của mình. Có lẽ dấu hiệu duy nhất để nhận ra đây là clip do AI dựng nên là việc chiếc thìa dùng để khuấy bột đột nhiên hiện ra và biến mất.
Clip được đăng tải trên tài khoản X của Bill Peebles, một trong những nhà khoa học nghiên cứu của OpenAI.
Như OpenAI cho biết trong thông báo giới thiệu Sora của mình, mô hình AI này vẫn mắc phải một số lỗi trong khung cảnh khiến người dùng có thể nhận ra đây là một sản phẩm của AI. Nhưng với chất lượng video được sản sinh như hiện tại, đến một lúc nào đó liệu nó có làm người dùng không thể phân biệt nổi đâu là một clip được quay trong thực tế với hình ảnh do AI tạo ra hay không?
Liệu một tương lai giống như trong phim Ma Trận có đến với nhân loại, khi những hình ảnh do máy tính tạo ra khiến người dùng không thể được đâu là ảnh ảo với đâu là thực tại?