Chatbot đã trải qua một cuộc lột xác đáng kể trong những năm gần đây. Từ chức năng đơn thuần là sinh văn bản, các chatbot hiện đại, tiêu biểu là ChatGPT, đã tiến thêm một bước dài khi sở hữu khả năng tạo ra hình ảnh sống động và phức tạp. Sự nâng cấp mới nhất này đánh dấu một cột mốc quan trọng, đưa khả năng sinh hình của ChatGPT lên một tầm cao mới, cho phép nó đáp ứng những yêu cầu phức tạp và sáng tạo chưa từng có trước đây từ người dùng.
OpenAI, đơn vị phát triển ChatGPT, tự hào khẳng định công nghệ mới này giúp ChatGPT tạo ra những hình ảnh chi tiết, chân thực và đáp ứng được cả những hướng dẫn khó nhằn nhất. Khả năng này thể hiện rõ nét qua việc ChatGPT có thể dễ dàng tạo ra một bộ truyện tranh bốn tấm, mỗi tấm đều có nhân vật đang trò chuyện với nhau – một nhiệm vụ trước đây đòi hỏi nhiều bước xử lý phức tạp. Các phiên bản trước đây của ChatGPT mặc dù cũng có khả năng sinh hình, nhưng độ chính xác và khả năng phối hợp các khái niệm lại với nhau để tạo ra kết quả có ý nghĩa vẫn còn hạn chế.
Với sự ra đời của nền tảng GPT-4o, ChatGPT không chỉ dừng lại ở việc tạo hình ảnh và văn bản mà còn có khả năng xử lý thông tin đa dạng dưới nhiều dạng thức khác nhau như giọng nói, hình ảnh và video. Thậm chí, nó còn có thể tổng hợp thông tin này và phát âm thành các câu hoàn chỉnh, mở ra một chân trời mới cho tương tác giữa người dùng và máy móc.
OpenAI nâng cấp chức năng tạo hình ảnh cho ChatGPT, người dùng miễn phí cũng được sử dụng- Ảnh 1.
Một ví dụ ấn tượng là khả năng tạo ra các trang truyện tranh sống động và hấp dẫn, như hình ảnh minh họa từ New York Times được trình bày bên dưới. Đây chính là minh chứng rõ ràng cho sự tiến bộ vượt bậc của công nghệ sinh hình trong ChatGPT.
Một trang truyện tranh do ChatGPT sản sinh – Ảnh: NYT.
Sự ra mắt phiên bản ChatGPT nâng cấp này, cùng với những cập nhật tương tự từ Google với Gemini hay xAI với Grok, phản ánh một xu hướng lớn trong ngành trí tuệ nhân tạo. Từ những hệ thống ban đầu chỉ tập trung vào việc tạo văn bản, chatbot đang dần chuyển mình thành những công cụ đa năng, kết hợp khả năng trò chuyện với nhiều chức năng khác nhau, mang lại trải nghiệm phong phú hơn cho người dùng.
“Đây là một loại công nghệ hoàn toàn mới,” Gabriel Goh, một nhà nghiên cứu tại OpenAI, chia sẻ. “Chúng tôi không tách biệt việc tạo hình ảnh và tạo văn bản. Chúng tôi muốn thực hiện tất cả tác vụ một lúc.” Phát biểu này nhấn mạnh triết lý thiết kế tập trung vào sự liền mạch và tổng hợp của ChatGPT phiên bản mới.
Trước đây, các công cụ tạo hình ảnh AI thường gặp khó khăn trong việc xử lý các yêu cầu hình ảnh khác biệt so với những khái niệm đã được định hình sẵn. Ví dụ, việc tạo ra một chiếc xe đạp với bánh xe hình tam giác là một thử thách lớn đối với các hệ thống cũ. Tuy nhiên, ChatGPT phiên bản mới đã chứng minh khả năng vượt trội trong việc xử lý những yêu cầu phức tạp và bất thường này.
Ông Goh cho biết phiên bản ChatGPT mới có thể xử lý những yêu cầu khác thường như vậy một cách mượt mà và hiệu quả. Điều này mở ra vô vàn khả năng sáng tạo mới cho người dùng, cho phép họ thỏa sức tưởng tượng và tạo ra những hình ảnh độc đáo, vượt ngoài khuôn khổ thông thường.
OpenAI nâng cấp chức năng tạo hình ảnh cho ChatGPT, người dùng miễn phí cũng được sử dụng- Ảnh 2.
Khái niệm về một chiếc xe đạp có bánh hình tam giác đã từng làm khó ChatGPT phiên bản cũ – Ảnh: OpenAI.
Phiên bản mới của ChatGPT sẽ được cập nhật trên cả hai phiên bản miễn phí và trả phí, bao gồm ChatGPT Plus (20 USD/tháng) và ChatGPT Pro (200 USD/tháng). Sự phổ biến rộng rãi này hứa hẹn sẽ mang đến những trải nghiệm công nghệ tiên tiến cho nhiều người dùng hơn nữa.
Tuy nhiên, ChatGPT phiên bản mới vẫn còn một số hạn chế nhất định. Việc “bịa” thông tin vẫn có thể xảy ra, và khả năng sinh văn bản nằm ngoài bảng chữ cái La tinh vẫn chưa được tối ưu hóa hoàn toàn. Thêm vào đó, việc xử lý đồng thời nhiều khái niệm phức tạp (ví dụ, tạo hình ảnh bảng tuần hoàn các nguyên tố hóa học) vẫn còn là một thách thức.
OpenAI nâng cấp chức năng tạo hình ảnh cho ChatGPT, người dùng miễn phí cũng được sử dụng- Ảnh 3.
Bảng tuần hoàn hóa học chưa thể đúng được hết – Ảnh: OpenAI.
OpenAI cam kết sẽ tiếp tục nỗ lực để khắc phục những hạn chế này trong tương lai, hướng tới mục tiêu hoàn thiện hơn nữa khả năng của ChatGPT. Sự phát triển không ngừng này hứa hẹn sẽ mang đến nhiều đột phá hơn nữa trong lĩnh vực trí tuệ nhân tạo, mở ra những tiềm năng to lớn cho nhiều ứng dụng khác nhau trong cuộc sống. Sự kết hợp giữa khả năng sinh văn bản và hình ảnh mạnh mẽ của ChatGPT hứa hẹn sẽ cách mạng hóa nhiều ngành công nghiệp và tạo ra những trải nghiệm hoàn toàn mới mẻ cho người dùng trên toàn thế giới. Việc tiếp tục theo dõi sự phát triển của ChatGPT là điều vô cùng đáng mong đợi.