ChatGPT đang là AI được nhắc đến nhiều nhất những tuần qua bởi khả năng trả lời câu hỏi, viết văn, dựng kịch bản… theo ý người dùng. Người dùng có thể hỏi “George Washington Carver là ai?” và nhận được câu trả lời từ Wikipedia tương tự Google. Tuy nhiên, sức mạnh của nó lớn hơn thế, khi cho phép sáng tạo vô hạn. Chẳng hạn, nếu yêu cầu “viết kịch bản phim về chiếc bánh kẹp taco đang khẩu chiến với chiếc hotdog trên bãi biển”, sẽ không có câu trả lời trên Google. Nhưng ChatGPT lập tức trả về kết quả trong vài giây.
OpenAI đã giới thiệu một AI trả lời câu hỏi dạng dài có tên là ChatGPT để trả lời các câu hỏi phức tạp một cách đàm thoại.
Đó là một công nghệ mang tính cách mạng vì nó được đào tạo để tìm hiểu ý nghĩa của con người khi họ đặt câu hỏi.
Nhiều người dùng kinh ngạc về khả năng cung cấp phản hồi chất lượng của con người, truyền cảm hứng rằng cuối cùng nó có thể có khả năng phá vỡ cách con người tương tác với máy tính và thay đổi cách truy xuất thông tin.
ChatGPT là gì
OpenAI đã giới thiệu một AI trả lời câu hỏi dạng dài có tên là ChatGPT để trả lời các câu hỏi phức tạp một cách đàm thoại.
Đó là một công nghệ mang tính cách mạng vì nó được đào tạo để tìm hiểu ý nghĩa của con người khi họ đặt câu hỏi.
Nhiều người sử dụng kinh ngạc về khả năng cung cấp phản hồi chất lượng của con người, truyền cảm hứng rằng cuối cùng nó có thể có khả năng phá vỡ cách con người tương tác với máy tính và thay đổi cách truy xuất thông tin.

Ai đã xây dựng ChatGPT?
ChatGPT được tạo bởi công ty trí tuệ nhân tạo OpenAI có trụ sở tại San Francisco. OpenAI Inc. là công ty mẹ phi lợi nhuận của OpenAI LP hoạt động vì lợi nhuận.
OpenAI nổi tiếng với DALL·E nổi tiếng, một mô hình học sâu tạo ra hình ảnh từ các hướng dẫn văn bản được gọi là lời nhắc.
Giám đốc điều hành là Sam Altman, người trước đây là chủ tịch của Y Combinator.
Microsoft là đối tác và nhà đầu tư với số tiền 1 tỷ đô la. Họ đã cùng nhau phát triển Nền tảng Azure AI.
Mô hình ngôn ngữ lớn
ChatGPT là một mô hình ngôn ngữ lớn (LLM). Mô hình ngôn ngữ lớn (LLM) được đào tạo với lượng dữ liệu khổng lồ để dự đoán chính xác từ nào tiếp theo trong câu.
Người ta phát hiện ra rằng việc tăng lượng dữ liệu sẽ làm tăng khả năng làm được nhiều việc hơn của các mô hình ngôn ngữ.
Theo Đại học Stanford
“GPT-3 có 175 tỷ tham số và được đào tạo trên 570 gigabyte văn bản. Để so sánh, người tiền nhiệm của nó, GPT-2, nhỏ hơn 100 lần với 1,5 tỷ tham số.
Sự gia tăng quy mô này làm thay đổi đáng kể hành vi của mô hình — GPT-3 có thể thực hiện các nhiệm vụ mà nó không được đào tạo rõ ràng, chẳng hạn như dịch các câu từ tiếng Anh sang tiếng Pháp, với rất ít hoặc không có ví dụ đào tạo.
Hành vi này hầu như không có trong GPT-2. Hơn nữa, đối với một số nhiệm vụ, GPT-3 vượt trội so với các mẫu được đào tạo rõ ràng để giải quyết các nhiệm vụ đó, mặc dù trong các nhiệm vụ khác, nó lại kém.”
ChatGPT có thể làm gì?
Với 175 tỷ tham số, thật khó để thu hẹp những gì GPT-3 làm. Như bạn có thể tưởng tượng, mô hình này bị giới hạn trong ngôn ngữ. Nó không thể tạo ra video, âm thanh hay hình ảnh như người anh em Dall-E 2, mà thay vào đó nó có khả năng hiểu sâu về văn nói và văn viết.
Điều này mang lại cho nó nhiều khả năng, mọi thứ, từ viết thơ, những câu chuyện tình lãng mạn sáo rỗng trong các vũ trụ song song, cho đến giải thích cơ học lượng tử bằng thuật ngữ đơn giản hoặc viết các bài nghiên cứu.
Mặc dù có thể thú vị khi sử dụng nhiều năm nghiên cứu của OpenAI để khiến AI viết các kịch bản hài độc thoại hoặc trả lời các câu hỏi về những người nổi tiếng yêu thích của bạn, nhưng sức mạnh của nó nằm ở tốc độ và sự hiểu biết về các vấn đề phức tạp.

Trong khi chúng ta có thể dành hàng giờ để nghiên cứu, tìm hiểu và viết một bài báo về cơ học lượng tử, thì ChatGPT có thể tạo ra một giải pháp thay thế được viết tốt chỉ trong vài giây.
Nó có những hạn chế và phần mềm của nó có thể dễ dàng bị nhầm lẫn nếu lời nhắc của bạn bắt đầu trở nên quá phức tạp hoặc ngay cả khi bạn hỏi quá chi tiết.
Ngoài ra, nó không thể xử lý các khái niệm quá mới. Các sự kiện thế giới đã xảy ra trong năm qua sẽ được diễn giải với kiến thức hạn chế và mô hình đôi khi có thể tạo ra thông tin sai lệch hoặc nhầm lẫn.
OpenAI cũng rất ý thức về các hành vi làm cho AI tạo ra nội dung đen tối, có hại hoặc thiên vị. Giống như trình tạo hình ảnh Dall-E trước đây, ChatGPT sẽ ngăn bạn hỏi những câu hỏi không phù hợp hoặc cảnh báo những yêu cầu nguy hiểm.
ChatGPT hoạt động như thế nào?
Nhìn bề ngoài, công nghệ của GPT-3 rất đơn giản. Nó nhận các yêu cầu, câu hỏi hoặc lời nhắc của bạn và nhanh chóng trả lời chúng. Như bạn có thể tưởng tượng, công nghệ để làm điều này phức tạp hơn nhiều so với tưởng tượng.
Mô hình được đào tạo bằng cách sử dụng cơ sở dữ liệu văn bản từ internet. Điều này bao gồm 570GB dữ liệu khổng lồ thu được từ sách, văn bản web, Wikipedia, bài báo và các phần viết khác trên internet. Nói chính xác hơn, 300 tỷ từ đã được đưa vào hệ thống.
Là một mô hình ngôn ngữ, nó hoạt động dựa trên xác suất, có thể đoán từ tiếp theo sẽ là gì trong một câu. Để đến giai đoạn có thể làm được điều này, mô hình đã trải qua giai đoạn thử nghiệm có giám sát.
Tại đây, nó được cung cấp đầu vào, chẳng hạn “Gỗ của cây có màu gì?”. Nếu mô hình trả lời sai, câu trả lời đúng được nhập vào hệ thống, dạy cho hệ thống câu trả lời đúng và giúp hệ thống xây dựng kiến thức.
Sau đó, nó trải qua giai đoạn tương tự thứ hai, đưa ra nhiều câu trả lời và xếp hạng chúng từ tốt nhất đến kém nhất, đào tạo mô hình về so sánh.
Điều làm nên sự khác biệt của công nghệ này là nó tiếp tục học trong khi đoán từ tiếp theo sẽ là gì, không ngừng nâng cao hiểu biết của nó về các gợi ý và câu hỏi.
Có trình tạo ngôn ngữ AI nào khác không?
Mặc dù GPT-3 đã tự tạo nên tên tuổi cho mình bằng khả năng ngôn ngữ nhưng nó không phải là AI duy nhất có khả năng làm điều này. LaMDA của Google đã gây chú ý khi một kỹ sư của Google bị sa thải vì gọi nó là thực tế đến mức anh ta tin rằng nó có tri giác.
Ngoài ra còn có rất nhiều ví dụ khác về các phần mềm này do Microsoft, Amazon hay Đại học Stanford tạo ra. Hầu hết các mô hình này không được mở quyền truy cập cho công chúng, nhưng OpenAI đã bắt đầu mở quyền truy cập vào GPT-3 trong quá trình thử nghiệm của nó và LaMDA của Google cho phép một số nhóm được thử nghiệm có hạn chế.
Google chia Chatbot của mình thành các tính năng như nói chuyện, liệt kê và tưởng tượng, cung cấp các demo về khả năng của nó trong các lĩnh vực này. Bạn có thể yêu cầu nó tưởng tượng về một thế giới nơi loài rắn thống trị thế giới, yêu cầu nó tạo danh sách các bước để học cách đi xe đạp một bánh hoặc chỉ trò chuyện về suy nghĩ của loài chó.
Hạn chế của ChatGPT là gì?
Hạn chế về phản ứng độc hại (toxic response)
ChatGPT được lập trình đặc biệt để không cung cấp các phản hồi độc hại hoặc có hại. Vì vậy, nó sẽ tránh trả lời những loại câu hỏi.
Chất lượng câu trả lời phụ thuộc vào chất lượng chỉ đường
Một hạn chế quan trọng của ChatGPT là chất lượng của đầu ra phụ thuộc vào chất lượng của đầu vào. Nói cách khác, hướng dẫn của chuyên gia (lời nhắc) tạo ra câu trả lời tốt hơn.
Câu trả lời không phải lúc nào cũng đúng
Một hạn chế khác là vì nó được đào tạo để cung cấp câu trả lời phù hợp với con người, nên câu trả lời có thể đánh lừa con người rằng kết quả đầu ra là chính xác.
Nhiều người dùng phát hiện ra rằng ChatGPT có thể đưa ra câu trả lời không chính xác, bao gồm một số câu trả lời cực kỳ sai.
Người điều hành tại trang web Hỏi & Đáp mã hóa Stack Overflow có thể đã phát hiện ra hậu quả không mong muốn của các câu trả lời mà con người cảm thấy đúng.
Stack Overflow tràn ngập phản hồi của người dùng được tạo từ ChatGPT có vẻ đúng, nhưng rất nhiều câu trả lời sai.
OpenAI giải thích những hạn chế của ChatGPT
Thông báo OpenAI đưa ra cảnh báo này:
“ChatGPT đôi khi viết những câu trả lời nghe có vẻ hợp lý nhưng không chính xác hoặc vô nghĩa.
Khắc phục sự cố này là một thách thức, vì:
(1) trong quá trình đào tạo RL, hiện tại không có nguồn sự thật nào;
(2) huấn luyện mô hình trở nên thận trọng hơn khiến nó từ chối các câu hỏi mà nó có thể trả lời đúng; và
(3) đào tạo có giám sát đánh lừa mô hình vì câu trả lời lý tưởng phụ thuộc vào những gì mô hình biết, hơn là những gì người biểu tình biết.”
Các mô hình ngôn ngữ sẽ thay thế Tìm kiếm của Google?
Bản thân Google đã tạo ra một chatbot AI có tên là LaMDA. Hiệu suất của chatbot của Google gần giống với cuộc trò chuyện của con người đến nỗi một kỹ sư của Google đã tuyên bố rằng LaMDA có tri giác.
Dựa vào cách các mô hình ngôn ngữ lớn này có thể trả lời rất nhiều câu hỏi, liệu một ngày nào đó một công ty như OpenAI, Google hay Microsoft có thể thay thế tìm kiếm truyền thống bằng một chatbot AI hay không?
Một số người trên Twitter đã tuyên bố rằng ChatGPT sẽ là Google tiếp theo.