Một mô hình AI tự học cách tư duy để giải quyết vấn đề, không cần con người

Trí tuệ nhân vv88 slot (AI) ngày càng thông minh hơn, nhưng vẫn có vv88 website chính thức giới hạn. Một trong vv88 website chính thức thách thức lớn nhất là dạy các mô hình AI tiên tiến cách suy luận, tức là giải quyết vấn đề từng bước một. Nhưng trong một bài báo mới được công bố trên tạp chí Nature, nhóm nghiên cứu từ DeepSeek AI, một công ty AI của Trung Quốc, báo cáo rằng họ đã có thể dạy mô hình R1 của mình tự suy luận mà không cần sự can thiệp của con người.

 

Khi chúng ta cố gắng giải quyết một vấn đề, chúng ta thường không có ngay câu trả lời. Chúng ta tuân theo một quy trình có phương pháp, có thể bao gồm việc thu thập thông tin và ghi chú cho nhà cái vv88 khi tìm ra giải pháp. Theo truyền thống, việc đào vv88 slot các mô hình AI để suy luận liên quan nhà cái vv88 việc sao chép cách tiếp cận của chúng ta. Tuy nhiên, đây là một quá trình kéo dài, trong đó con người phải cho mô hình AI xem vô số ví dụ về cách giải quyết một vấn đề. Điều này cũng có nghĩa là AI chỉ giỏi bằng vv88 website chính thức ví dụ được cung cấp và có thể tiếp thu vv88 website chính thức thành kiến của con người.

Thay vì chỉ cho mô hình R1 từng bước, các nhà nghiên cứu tại DeepSeek AI đã sử dụng một kỹ thuật gọi là học tăng cường (reinforcement learning). Cách tiếp cận thử và sai này, sử dụng phần thưởng cho các câu trả lời đúng, đã khuyến khích mô hình tự suy luận.

Mô hình DeepSeek R1 được đào vv88 slot trên các bài toán toán học, lập trình và khoa học khó. Phần thưởng duy nhất mà nó nhận được là tín hiệu cho biết câu trả lời cuối cùng của nó là đúng. Trong quá trình đào vv88 slot, các nhà nghiên cứu đã thấy nó phát triển các kỹ năng như tự kiểm tra công việc và khám phá các chiến lược khác nhau để tìm ra giải pháp. Nó thậm chí còn bắt đầu sử dụng các từ như "chờ đã" khi tự phản ánh về quá trình suy nghĩ của mình. Nếu một hướng đi dẫn nhà cái vv88 câu trả lời đúng, chiến lược đó sẽ được củng cố. Nếu nó sai, mô hình sẽ học cách không lặp lại nó. Có một số sự can thiệp của con người, nhưng chỉ để trau dồi các kỹ năng của R1 sau này trong quá trình.

Kết quả thật ấn tượng. R1 hoạt động tốt hơn trong các nhiệm vụ toán học, lập trình và khoa học so với các mô hình cũ được đào vv88 slot với sự hướng dẫn của con người. Một trong vv88 website chính thức kết quả đáng chú ý nhất là nó đã đạt được độ chính xác 86,7% trong Kỳ thi Toán học Mời gọi Hoa Kỳ (AIME) 2024, một cuộc thi toán khó dành cho vv88 website chính thức học sinh trung học thông minh nhất.

Ngay cả với vv88 website chính thức kết quả xuất sắc này, các nhà nghiên cứu thừa nhận mô hình của họ có một số hạn chế cần khắc phục. Ví dụ, đôi khi nó trộn lẫn các ngôn ngữ khi được đưa ra một lời nhắc không phải tiếng Anh và làm cho một số vấn đề đơn giản trở nên phức tạp hơn mức cần thiết. Nhưng một khi vv88 website chính thức vấn đề này được giải quyết, các nhà nghiên cứu tin rằng một mô hình AI có thể tự suy luận sẽ dẫn nhà cái vv88 một kỷ nguyên mới của các mô hình có năng lực và tự chủ hơn.

P.T.T (NASTIS), theo https://techxplore.com/news/, 2025

Tác giả bài viết: PTT