Công nghệ mới của khả năng xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) từ dự án Project Debater, thuộc Viện nghiên cứu IBM Research lần đầu tiên được thương mại hóa. Đây là hệ thống AI duy nhất có khả năng tranh luận với con người về các chủ đề phức tạp.
Ví dụ, hệ thống đã lần đầu tiên đưa vào một tính năng phân tích cảm tính nâng cao mới để xác định và phân tích thành ngữ và những câu nói thông dụng. Các cụm từ, như “hầu như không hữu ích”, hoặc “nóng bỏng tay” đã thách thức các hệ thống AI vì chúng rất khó để các thuật toán phát hiện ra.
Các công nghệ của Project Debater bắt đầu được tích hợp vào Watson của IBM kể từ hôm nay và trong suốt thời gian tới sẽ tập trung vào việc nâng cao khai phá ngôn ngữ con người và được chia ra thành các điểm nhấn chính như sau: Phân tích (Analysis) - IBM đã tăng cường phân tích cảm tính để có thể xác định và hiểu rõ hơn các lược đồ từ vựng phức tạp như các cụm từ và biểu ngữ, mà khi kết hợp cùng nhau sẽ mang ý nghĩa mới. Công nghệ này sẽ được tích hợp vào công nghệ Hiểu biết ngôn ngữ tự nhiên của Watson trong tháng này. Ngoài ra, IBM cũng đưa ra công nghệ phân loại mới, cho phép khách hàng tạo ra các mô hình AI có thể dễ dàng phân loại các mệnh đề trong các tài liệu kinh doanh, như hợp đồng mua hàng. Công nghệ này sẽ được bổ sung vào Watson Discovery cuối năm nay. Tóm tắt (Briefs) - Công nghệ này lấy dữ liệu văn bản từ nhiều nguồn khác nhau để cung cấp cho người dùng bản tổng kết về những gì đang được nói và viết về một chủ đề cụ thể. Phiên bản đầu tiên đã được sử dụng tại Lễ trao giải Grammys năm nay để phân tích hơn 18 triệu bài viết, blog và tiểu sử để đưa ra những hiểu biết sâu sắc về hàng trăm nghệ sĩ và người nổi tiếng tham gia vào giải thưởng danh giá này. Dữ liệu sau đó được truyền tới các kênh phát sóng trực tiếp từ thảm đỏ, các video và hình ảnh theo yêu cầu trên trang web www.grammy.com để mang đến cho người hâm mộ bối cảnh sâu sắc hơn về các chủ đề hàng đầu của đêm trao giải. Công nghệ này được lên kế hoạch để bổ sung vào công nghệ Hiểu biết ngôn ngữ tự nhiên của IBM Watson trong thời gian từ nay tới cuối năm. Phân cụm (Clustering) – Được xây dựng từ những kết quả nghiên cứu của Project Debater, công nghệ phân cụm các chủ đề sẽ cho phép người sử dụng phân chia các dữ liệu theo từng nhóm cụm riêng biệt và tạo ra các chủ đề có ý nghĩa theo thông tin liên quan, sau đó có thể phân tích nhanh chóng và phù hợp. Công nghệ này sẽ được tích hợp vào Watson Discovery trong năm nay, cho phép các chuyên gia tùy chỉnh và tinh chỉnh các chủ đề liên quan, nhằm phản ánh ngôn ngữ theo nhóm doanh nghiệp hoặc ngành cụ thể, như bảo hiểm, y tế và sản xuất. IBM đã đưa công nghệ NLP của IBM Research ra thị trường thông qua các công nghệ Watson. Các sản phẩm như Watson Discovery để hiểu văn bản, Watson Assistant cho các trợ lý ảo, và Watson Natural Language Understanding cho phân tích cảm tính nâng cao đều được tích hợp NLP. Cụ thể, Kênh Fantasy Football của ESPN sử dụng Watson Discovery và Watson Knowledge Studio để phân tích hàng triệu nguồn dữ liệu liên quan tới môn thể thao bóng bầu dục Mỹ mỗi ngày thông quá các mùa giải, nhằm đưa ra các nhận định ngay lập tức cho người hâm mộ. Bằng cách xử lý ngôn ngữ tự nhiên, Watson xác định giọng điệu và tình cảm của các bài báo, blog, diễn đàn, bảng xếp hạng, dự đoán, các ý kiến bình luận trên các mạng xã hội, bao gồm mọi thứ, từ tham quan phòng thay đồ đến phân tích chấn thương cầu thủ. |