Sinh viên Trường ĐH FPT Hà Nội phát triển trợ lý AI pháp lý
Hệ thống trợ lý pháp lý ảo tiếng Việt (Vietnamese Legal Assistant System - VNLAS) ứng dụng AI do nhóm sinh viên chuyên ngành Trí tuệ nhân tạo, Trường ĐH FPT Hà Nội phát triển, với mong muốn góp phần phổ biến và khuyến khích người dân tiếp cận, hiểu đúng và tuân thủ pháp luật.
Đây là một hệ thống đa tác tử AI (multi-agent AI) gồm 5 Agent AI kết hợp và thực hiện các tác định khác nhau như phân tích, truy xuất dữ liệu, nghiên cứu và trả lời câu hỏi. Hệ thống hoạt động dựa trên phương pháp IRAC (Issue - Rule - Application - Conclusion), được xem là xương sống trong lập luận và giải quyết các vấn đề pháp lý.
Theo đó, Agent AI 1 là cổng giao tiếp đầu tiên trong hệ thống, có nhiệm vụ tiếp nhận, xác định loại câu hỏi và mức độ phức tạp. Dựa trên nội dung câu hỏi, Agent 1 sẽ xác định loại truy vấn và chuyển đến các Agent chuyên biệt tiếp theo.
“Khi người dùng đặt ra các câu hỏi nằm ngoài phạm vi cơ sở dữ liệu, hệ thống sẽ gợi ý các câu hỏi liên quan hoặc điều hướng tới các nguồn tham khảo uy tín”, đại diện nhóm sinh viên chia sẻ.
Sau khi tiếp nhận thông tin từ Agent 1, Agent AI 2 sẽ phân tích và nhận diện vấn đề pháp lý từ câu hỏi của người dùng (issue), sau đó Agent AI 3 và 4 tìm kiếm quy định pháp luật cụ thể, rà soát thông tin từ các nguồn luật như điều ước, tập quán hay án lệ (rule). Tiếp theo, hệ thống sẽ đối chiếu quy định đã xác định với dữ liệu của vụ việc để đưa ra lập luận pháp lý chính xác, logic và thuyết phục (application). Cuối cùng, Agent AI 5 đảm nhận vai trò biên tập và trả về kết luận dưới dạng câu trả lời hoàn chỉnh (conclusion).
Nhóm sinh viên Trường ĐH FPT Hà Nội xây dựng hệ thống trợ lý pháp lý ảo tiếng Việt VNLAS dựa trên các mô hình công nghệ tiên tiến hiện nay. Trọng tâm là mô hình ngôn ngữ lớn (LLM) Qwen 2.5, được tinh chỉnh để xử lý và tư vấn các vấn đề pháp lý. Với khả năng nắm bắt ngôn ngữ, logic và ngữ cảnh, mô hình Qwen 2.5 cung cấp câu trả lời có tính chuyên môn cao như tư vấn pháp lý chuyên sâu, phù hợp với yêu cầu thực tế của người hỏi. Để tinh chỉnh mô hình LLM này, nhóm đã áp dụng phương pháp LoRA (Low-Rank Adaptation), giúp giảm lượng tham số cần lưu trữ và tăng hiệu quả huấn luyện.
Đặc biệt, hệ thống sử dụng khung Retrieval-Augmented Generation (RAG) - một kỹ thuật nâng cao độ chính xác và độ tin cậy của các mô hình GenAI để truy xuất thông tin pháp luật từ dữ liệu pháp lý bên ngoài và sử dụng cho quá trình sinh câu trả lời của mô hình LLM. Kỹ thuật này giúp giảm thiểu đáng kể tình trạng “ảo giác” - hiện tượng mô hình AI đưa ra thông tin sai lệch hoặc không có cơ sở.
Để tăng khả năng phân tích của mô hình LLM, nhóm sinh viên đã ứng dụng cơ sở dữ liệu Vector và biểu đồ tri thức (Knowledge Graph) giúp tối ưu hóa việc tìm kiếm và phân tích thông tin pháp luật.
Theo đó, cơ sở dữ liệu Vector (Qdrant) cho phép hệ thống tìm kiếm các văn bản pháp luật liên quan một cách nhanh chóng, trong khi Knowledge Graph sử dụng cơ sở dữ liệu đồ thị Neo4j để biểu diễn mối quan hệ giữa các khái niệm pháp lý, hỗ trợ mô hình LLM suy luận logic. Kết hợp hai loại cơ sở dữ liệu này, VNLAS có thể xử lý các truy vấn pháp lý phức tạp, đảm bảo hiệu suất, logic và độ chính xác.
Hệ thống VNLAS đã được kiểm thử trên một bộ kiểm chuẩn benchmark do nhóm sinh viên tự xây dựng dựa trên chuẩn LawBench - bộ tiêu chuẩn cho các hệ thống pháp lý. Kết quả thử nghiệm cho thấy VNLAS đạt hiệu suất vượt trội. Đặc biệt, trong các nhiệm vụ phức tạp như phân tích vụ việc và đưa ra tư vấn pháp lý, VNLAS có khả năng suy luận logic và thời gian xử lý nhanh.
Quá trình xây dựng hệ thống cũng gặp không ít thách thức. Một trong những khó khăn lớn nhất là việc thiếu dữ liệu pháp lý tiếng Việt chất lượng cao. Để khắc phục, nhóm đã thu thập dữ liệu từ nhiều nguồn uy tín như cơ sở dữ liệu pháp luật Việt Nam, pháp điển Việt Nam và tiến hành chuẩn hóa, phân đoạn dữ liệu một cách tỉ mỉ. Nhóm cũng kết hợp cơ sở dữ liệu nhân tạo từ GPT-4o, Gemini 1.5 Flash để tăng khả năng suy luận và xử lý các truy vấn phức tạp của hệ thống.
Hệ thống VNLAS mang lại nhiều lợi ích thực tiễn. Đối với các chuyên gia pháp lý, hệ thống giúp tiết kiệm thời gian trong việc tìm kiếm, phân tích thông tin pháp luật, nâng cao chuyên môn. Đồng thời, VNLAS còn giúp người dân tiếp cận các dịch vụ tư vấn pháp lý chính xác và đáng tin cậy, từ đó góp phần nâng cao nhận thức pháp luật của cộng đồng.
Với phương pháp, công nghệ ứng dụng hiện đại, hệ thống VNLAS của nhóm sinh viên FPT nhận được đánh giá tích cực từ Hội đồng chuyên môn về tính sáng tạo và ứng dụng cao. Nếu được đầu tư thêm về tài nguyên lưu trữ và tối đa hóa hiệu quả của các mô hình ngôn ngữ lớn trong mỗi Agent AI, hệ thống có thể ứng dụng rộng rãi và tiến tới thương mại.
Từ ngày 10/12 – 25/12/2024, sinh viên Trường Đại học FPT sẽ bắt đầu tham gia đợt bảo vệ tốt nghiệp học kỳ Fall 2024 tại Hà Nội, phân hiệu tại TP. HCM và phân hiệu tại Đà Nẵng. Đợt bảo vệ tốt nghiệp kỳ Fall 2024 ghi nhận nhiều đề tài đa dạng, hướng tới các lĩnh vực trong đời sống. Trong đó đáng chú là các đề tài liên quan tới văn hóa dân gian, nâng cao nhận thức về các vấn đề trong xã hội, hỗ trợ du lịch, phân phối nông sản - đặc sản địa phương, nền tảng kết nối và đặc biệt là phát triển các ứng dụng AI. Theo dõi thông tin tại website: https://fpt.edu.vn/ |
Thu Uyên - fpt.edu.vn