Tiếp tục truyền thống hàng tháng của Trường Công nghệ Thông tin và Truyền thông, Đại học Bách khoa Hà Nội, ngày 09 tháng 12 năm 2024, Nhà trường hân hạnh chào đón 2 giáo sư đầu ngành đến trao đổi tại hội thảo khoa học tháng 12 của Nhà trường: GS. Hajime Nagahara, đến từ Đại học Osaka, Nhật Bản; và GS. Andrei Valerievich Kopylov, đến từ Đại học Tula State University, CHLB Nga.
Bài trình bày đầu tiên có tên là “Cảm Biến Sâu: Tối ưu hóa Cảm biến và Xử lý Hình ảnh” của GS. Hajime Nagahara. Giáo sư đã thảo luận về khái niệm “cảm biến sâu”, bao gồm việc đồng thời tối ưu hóa cảm biến và xử lý, đặc biệt là trong các tác vụ thị giác máy tính. Ông đã nhấn mạnh cách học sâu đã cách mạng hóa khả năng hiểu hình ảnh và đưa ra các ví dụ về cách tối ưu hóa này có thể được áp dụng cho các kịch bản trong thế giới thực. Một ví dụ tập trung vào cảm biến video nén, trong đó các hạn chế của cảm biến máy ảnh truyền thống được giải quyết bằng cách sử dụng công nghệ màn trập ngẫu nhiên. Kỹ thuật này cho phép thu thập thông tin độ phân giải không gian và thời gian cao trong một khung hình duy nhất, sau đó được giải mã bằng các thuật toán học sâu để tái tạo video có độ phân giải đầy đủ. Giáo sư Nagahara đã chứng minh khái niệm này bằng cách giới thiệu một máy ảnh có tốc độ khung hình 71 FPS có thể đạt được đầu ra video được tái tạo là 1.000 FPS bằng cách thao tác các mẫu màn trập. Ông tiếp tục giải thích cách tiếp cận này có thể được mở rộng để tối ưu hóa thiết kế bộ lọc màu để nâng cao khả năng tái tạo video màu.
Ngoài các tác vụ tái tạo, Giáo sư Nagahara cũng đã thảo luận về việc áp dụng cảm biến sâu để nhận dạng hành động và bảo vệ quyền riêng tư. Ông giải thích cách mã hóa thông tin không gian và thời gian vào một hình ảnh duy nhất có thể cải thiện hiệu quả của các hệ thống nhận dạng hành động. Ngoài ra, ông đã trình bày nghiên cứu về việc làm giảm chất lượng hình ảnh trong khi vẫn duy trì tính hữu dụng của chúng cho việc nhận dạng hành động, giới thiệu một phương pháp đạt được độ chính xác nhận dạng hành động cao trong khi giảm đáng kể nguy cơ rò rỉ quyền riêng tư.
Trong phần trao đổi, Giáo sư Nagahara đã đề cập đến tiềm năng áp dụng cảm biến sâu cho các lĩnh vực khác, như chụp ảnh khoa học và khả năng tối ưu hóa cảm biến cho các tác vụ và ngữ cảnh cụ thể. Ông cũng đã chỉ ra việc áp dụng các nguyên tắc cảm biến sâu cho các công nghệ cảm biến độ sâu, chẳng hạn như thời gian bay, để có khả năng nâng cao độ phân giải độ sâu.
Bài trình bày tiếp theo của GS. Andrei Valerievich Kopylov có tiêu đề là “Các phương pháp đồ thị dễ giải thích xác định thứ tự vị trí của hạt nano trong ảnh hiển vi điện tử”. Giáo sư đã trình bày một cách tiếp cận mới để phân tích sự sắp xếp của các hạt nano trong hình ảnh hiển vi điện tử để phát hiện lỗi trong vật liệu carbon. Phương pháp này tập trung vào việc phát triển các đặc trưng diễn giải được, cho phép các nhà khoa học hiểu được lý do đằng sau kết quả phân loại, một khía cạnh quan trọng đối với điều tra khoa học và phân tích vật liệu. Bài thuyết trình đã nêu bật những hạn chế của các phương pháp học sâu trong các tình huống như vậy, đặc biệt là do bộ dữ liệu nhỏ và bản chất “hộp đen” của mạng nơ-ron.
Phương pháp được đề xuất tận dụng nhận thức của con người về trật tự và cấu trúc trong sự sắp xếp của các hạt nano. Nhóm nghiên cứu đã xác định hai khía cạnh chính: định hướng và tính tuyến tính. Bằng cách phân tích định hướng của các cụm hạt nano, các đặc trưng như tính nhất quán và độ tin cậy của các định hướng này đã được suy ra. Ngoài ra, các thuật toán đã được sử dụng để kết nối các hạt nano thành các đường, tạo ra các đặc trưng như số lượng, độ trơn mượt và tính tuyến tính của các đường được xây dựng này. Một phương pháp cây bao trùm tối thiểu cũng được sử dụng để phân đoạn hình ảnh và trích xuất các đặc trưng tiếp theo liên quan đến cấu trúc phân nhánh. Hiệu quả của các đặc trưng thủ công này đã được chứng minh thông qua khả năng phân loại thành công các hình ảnh có sự sắp xếp hạt nano có thứ tự và không có thứ tự, đạt được độ chính xác cao hơn so với các mô hình học sâu thông thường. Giáo sư Kopylov nhấn mạnh rằng khả năng diễn giải được của các đặc trưng này là rất quan trọng đối với các nhà hóa học và nhà khoa học vật liệu, vì nó cho phép họ hiểu được mối quan hệ giữa sự sắp xếp của hạt nano và các lỗi vật liệu cơ bản. Sự hiểu biết này có thể góp phần hơn nữa vào việc nghiên cứu các đặc tính xúc tác của hạt nano, liên kết tổ chức cấu trúc của chúng với hiệu quả của chúng trong việc gia tốc các phản ứng hóa học.
Bài thuyết trình đã khơi mào các trao đổi sôi nổi về lợi ích và hạn chế của các kỹ thuật chụp ảnh và phương pháp phân tích dữ liệu khác nhau. Các trao đổi tập trung vào tầm quan trọng của bộ dữ liệu thực so với bộ dữ liệu được mô phỏng, những thách thức của việc gắn nhãn dữ liệu cho các ứng dụng khoa học cụ thể và tiềm năng hợp tác giữa các nhà khoa học máy tính và các chuyên gia trong các lĩnh vực khác, như hóa học và khoa học vật liệu.
Bài thuyết trình của Giáo sư Kopylov đã làm nổi bật thành công sức mạnh của các đặc trưng diễn giải được trong khám phá khoa học, thể hiện một giải pháp thay thế hấp dẫn cho các phương pháp học sâu phổ biến cho các tác vụ cụ thể đòi hỏi tính minh bạch và khả năng giải thích.