FPT Edu - Tin tức chung

Lấy cảm hứng từ câu chuyện kể của GS Hoàng Chí Bảo, SV FPT Edu xây dựng chatbot Chủ tịch Hồ Chí Minh

10/09/2020
Vũ Thị Ngọc Ánh
147

Nhằm giúp mọi người có thêm hiểu biết về Chủ tịch Hồ Chí Minh, nhóm SV ĐH FPT đã tái hiện lại hình tượng Bác thông qua chatbot với quá trình học cùng trải nghiệm tại FPTU. Đây cũng chính là sản phẩm mà nhóm mang đến phòng bảo vệ đồ án tốt nghiệp kỳ Summer 2020.

Những bài học về phong cách, đạo đực của Bác hầu hết được truyền tải thông qua những bài viết trên báo chí, sách in… làm giảm đi sự sống động, chân thực về cuộc đời, con người của Bác. Lấy cảm hứng từ những câu chuyển kể của GS Hoàng Chí Bảo và cuốn sách viết về Bác “Hồ Chí Minh  một cuộc đời”, “Hồ Chí Mình những năm tháng chưa biết đến”, nhóm sinh viên với khí thế học cùng trải nghiệm gồm: Nguyễn Mạnh Cường, Đặng Tuấn Nam, Nguyễn Đặng Ngọc Phái, Hà Minh Hiếu và Phạm Bá Thành đã quyết định xây dựng hình tượng nhân vật Hồ Chí Minh ảo để tạo sự gần gũi với người dân Việt Nam hơn.

Nhóm SV bảo vệ đồ án tốt nghiệm kỳ Summer 2020.
Nhóm SV bảo vệ đồ án tốt nghiệp kỳ Summer 2020

Chatbot giúp tìm hiểu về Chủ tịch Hồ Chí Minh.

Nhóm xây dựng nhân vật ảo thông qua chatbot bằng việc áp dụng sự tiến bộ trong xử lý ngôn ngữ tự nhiên cho Tiếng Việt với nguồn tài liệu đã được xác thực và đảm bảo. Với chatbot này bất kì ai cũng có thể tìm hiểu thông tin cơ bản về Chủ tịch Hồ Chí Minh.

Theo đó, người dùng sẽ giao tiếp thông qua mục tin nhắn trên Facebook (Facebook Messenger). Tin nhắn sẽ được gửi tới một hệ thống xử lý ngôn ngữ tự nhiên để xử lý văn bản để chatbot hiểu được người dùng muốn hỏi thông tin nào, từ đó chatbot sẽ xử lý thông tin và gửi câu trả lời về cho người dùng. Ví dụ, khi người dùng nhập câu hỏi “Hồ Chí Minh sinh ra ở đâu? Chatbot sẽ nhận và xử lý thông tin, sau đó gửi lại câu trả lời “Ở làng Hoàng Trù, tên nôm là làng Chùa, cách làng Sen khoảng 2km”. Dựa trên các thông tin nguồn được thiết lập trước đó, chatbot sẽ đưa ra những cậu trả lời chính xác và chi tiết nhất tới người dùng.

Chia sẻ về điểm nổi bật của sản phẩm, Mạnh Cường – thành viên nhóm chia sẻ quá trình học cùng trải nghiệm, “Các nhóm đồ án trước chỉ xây dựng một chatbot trên những nền tảng có sẵn như Wit.AI. Tuy nhiên dữ liệu về Hồ Chí Minh có tính chất nhạy cảm, đặc thù riêng trong khi đó Wit.AI lại không đảm bảo được các dữ liệu này sẽ được bảo mật.  Bên cạnh đó, hệ thống của Wit.AI cũng không cho phép can thiệp để nghiên cứu và phát triển hệ thống xử lý ngôn ngữ tự nhiên cho tiếng Việt sẽ gây ảnh hưởng đến số lượng người dùng  là người Việt. Chính vì vậy, nhóm quyết định dùng mã nguồn mở Rasa, có khả năng tích hợp các thuật toán xử lý ngôn ngữ tự nhiên, kết hợp với các nghiên cứu nổi tiếng cho tiếng Việt như: PhoBERT, VNcoreNLP để đưa ra 1 luồng xử lý cho chatbot.”

Việc này sẽ giúp cho các giai đoạn sau dễ dàng phát triển hơn khi muốn kiểm soát được luồng thay vì phụ thuộc vào Wit.AI. Trước mắt, do thời gian có hạn nên đồ án này nhóm tập trung phát triển một chatbot giao tiếp bằng văn bản. Các giai đoạn sau sẽ có thể giao thiếp bằng giọng nói để tăng sự gần gũi, sinh động cho người dùng”, Cường cho biết thêm.

Để có thể xây dựng thành công chatbot Hồ Chí Minh, nhóm đã dành nhiều thời gian để đọc tài liệu liên quan đến Bác như: Hồ Chí Minh toàn tập gồm 3 quyển, mỗi quyển khoảng 600 trang để trích xuất câu hỏi. Đây là khó khăn khá lớn đối với nhóm trong thời gian thực hiện đồ án. Bên cạnh đó, các thành viên trong nhóm cũng chưa có kinh nghiệm về xử lý ngôn ngữ tự nhiên nên phải tự tìm hiểu và nghiên cứu trong 3 tuần mới có thể chính thức bắt tay vào việc.

“Đồ án tốt nghiệp thực sự là một minh chứng để cả nhóm thấy được sự trưởng thành của bản thân với quá trình học cùng trải nghiệm sau 4 năm học tại ĐH FPT. Kỹ năng mềm, kiến thức chuyên môn đều được nâng lên và hoàn thiện trong quá trình làm đồ án. Từ một nhóm không biết về hệ thống ngôn ngữ tự nhiên, chứ có một sản phẩm cộp mác tên mình nhưng cuối cùng những điều này đều được hoàn thành trong buổi bảo vệ tốt nghiệp”, Mạnh Cường hào hứng kể.

 
147

Nhân vật