Seminar khoa học về mở rộng quy mô học đa phương thức tại trường CNTT&TT

Seminar khoa học về mở rộng quy mô học đa phương thức tại trường CNTT&TT

Sáng 15/08/2025, Trường Công nghệ Thông tin và Truyền thông (SoICT) – ĐH Bách khoa Hà Nội đã tổ chức thành công buổi seminar với chủ đề: “Scaling Multi-Modal Learning: Hybrid Representations and Efficient Adaptation” (Mở rộng quy mô học đa phương thức: các phương pháp biểu diễn lai và thích ứng hiệu quả)

Trong phần trình bày, Nguyễn Hồ Minh Duy (Planck Research School for Intelligent Systems (IMPRS-IS), University of Stuttgart) giới thiệu nghiên cứu về các mô hình AI với trọng tâm là tính thích ứng và hiệu quả tính toán. Anh đặc biệt nhấn mạnh kỹ thuật nén cho các mô hình ngôn ngữ lớn, một hướng tiếp cận nhằm giúp mô hình hoạt động hiệu quả hơn trên hạ tầng tính toán hạn chế.

Bài trình bày đã giới thiệu ba hướng nghiên cứu chính gồm thuật toán học máy, hệ thống bổ sung nitơ và robot. Diễn giả cũng chia sẻ công trình về khớp đồ thị, xử lý hình ảnh y tế với mục tiêu cung cấp kết quả chẩn đoán kèm bằng chứng trực quan cho bác sĩ. Bên cạnh đó, anh đã chỉ ra thách thức lớn hiện nay là việc nén mô hình để có thể triển khai trên phần cứng yếu.

Một điểm nhấn khác là kỹ thuật mới mang tên “Bosting subdrug” được giới thiệu để giảm số lượng token trong các mô hình Transformer. Phương pháp này giúp tăng tốc độ xử lý lên đến 40% trong khi vẫn giữ được độ chính xác, đồng thời có thể áp dụng trực tiếp trên các mô hình đã huấn luyện sẵn.

Tiếp đó, Anh Duy đã trình bày thuật toán tối ưu hóa token, cho phép giảm số lượng token xuống chỉ còn 5–10% mà vẫn duy trì hiệu suất. Kỹ thuật này đặc biệt hữu ích trong nhiều ứng dụng như xe tự lái, robot hút bụi hay hệ thống giao dịch. Diễn giả cũng nêu ba thách thức lớn cần giải quyết: mức độ mất mát thông tin, cơ chế học hiệu quả và khả năng mở rộng sang các bài toán di truyền.

Phần cuối buổi seminar tập trung vào các giải pháp kỹ thuật cho những thiết bị có tài nguyên hạn chế. Diễn giả thảo luận về xử lý song song, nén mô hình, đồng thời chia sẻ kinh nghiệm hợp tác quốc tế trong các lĩnh vực như toán học y khoa và xử lý dữ liệu. Các câu hỏi về xử lý hình ảnh, phân loại văn bản và tối ưu hóa mô hình cũng được giải đáp cụ thể.

Dưới đây là một số hình ảnh tại seminar: