Cách bảo vệ tốt nhất chống lại AI deepfake có thể là. . . chớp mắt
Các nhà nghiên cứu hiện có thể phát hiện video giả do AI tạo ra với tỷ lệ thành công là 95% – và tất cả là nhờ vào mắt.
[Hình minh họa: Daniel Salo]
HƠN NHƯ THẾ NÀY
Quảng cáo Oreo này là một lời chào vô vọng đối với sự lịch sự của trẻ nhỏ trước một cuộc bầu cử gây tranh cãi
Lịch sử hấp dẫn của thiết kế sang trọng, từ lọ hoa nhím đến túi Chanel
Người Mỹ sẽ mất gì để thoát khỏi nỗi ám ảnh về những ngôi nhà chỉ có một gia đình?
BỞI SIWEI LYU3 PHÚT ĐỌC
Một dạng thông tin sai lệch mới đã sẵn sàng để lan truyền trên các cộng đồng trực tuyến khi các chiến dịch bầu cử giữa nhiệm kỳ 2018 nóng lên. Được gọi là "deepfakes" theo tên một tài khoản trực tuyến có biệt danh phổ biến kỹ thuật này –mà có thể đã chọn tên của nó vì quy trình sử dụng một phương pháp kỹ thuật gọi là “học sâu” –các video giả này trông rất giống thực.
Cho đến nay, mọi người đã sử dụng video deepfake trong nội dung khiêu dâm và châm biếm để làm cho những người nổi tiếng đang làm những việc mà bình thường họ không làm. Nhưng gần như chắc chắn những trò lừa đảo sâu sắc sẽ xuất hiện trong mùa chiến dịch , với mục đích mô tả các ứng viên nói những điều hoặc đi những nơi mà ứng viên thực sự không làm.
Vì những kỹ thuật này rất mới nên mọi người gặp khó khăn trong việc phân biệt giữa video thực và video deepfake. Công việc của tôi , với đồng nghiệp Ming-Ching Chang và Tiến sĩ của chúng tôi. sinh viên Yuezun Li, đã tìm ra một cách để kể các video thực một cách đáng tin cậy từ các video deepfake . Nó không phải là một giải pháp lâu dài, bởi vì công nghệ sẽ được cải thiện. Nhưng đó là một bước khởi đầu và mang đến hy vọng rằng máy tính sẽ có thể giúp mọi người nói ra sự thật từ những điều hư cấu.
[Hình minh họa: Daniel Salo]
“DEEPFAKE” LÀ GÌ?
Tạo một video deepfake cũng giống như dịch giữa các ngôn ngữ. Các dịch vụ như Google Dịch sử dụng máy học - máy tính phân tích hàng chục nghìn văn bản bằng nhiều ngôn ngữ – để phát hiện các mẫu sử dụng từ mà chúng sử dụng để tạo bản dịch.
Các thuật toán Deepfake hoạt động theo cách tương tự: Chúng sử dụng một loại hệ thống học máy được gọi là mạng thần kinh sâu để kiểm tra các chuyển động trên khuôn mặt của một người. Sau đó, họ tổng hợp hình ảnh khuôn mặt của người khác tạo ra các chuyển động tương tự. Làm như vậy một cách hiệu quả sẽ tạo ra một video về người mục tiêu dường như làm hoặc nói những điều mà người nguồn đã làm.
Trước khi chúng có thể hoạt động bình thường, mạng nơ-ron sâu cần nhiều thông tin nguồn, chẳng hạn như ảnh của người là nguồn gốc hoặc mục tiêu của việc mạo danh. Càng nhiều hình ảnh được sử dụng để đào tạo thuật toán deepfake, thì việc mạo danh kỹ thuật số càng thực tế.
[Hình minh họa: Daniel Salo]
PHÁT HIỆN NHẤP NHÁY
Vẫn còn những sai sót trong loại thuật toán mới này. Một trong số chúng liên quan đến cách các khuôn mặt mô phỏng nhấp nháy – hoặc không. Những người trưởng thành khỏe mạnh chớp mắt ở đâu đó trong khoảng từ 2 đến 10 giây một lần, và một lần chớp mắt diễn ra từ 1/10 đến 4/10 giây . Đó là những gì bình thường để xem trong một video có một người đang nói chuyện. Nhưng nó không phải là những gì xảy ra trong nhiều video deepfake.
Khi một thuật toán deepfake được đào tạo trên hình ảnh khuôn mặt của một người, nó phụ thuộc vào những bức ảnh có sẵn trên internet có thể được sử dụng làm dữ liệu đào tạo. Ngay cả đối với những người thường xuyên được chụp ảnh, rất ít hình ảnh trên mạng cho thấy họ đang nhắm mắt. Những bức ảnh như vậy không chỉ hiếm - bởi vì mắt của mọi người hầu hết thời gian mở - nhưng các nhiếp ảnh gia thường không xuất bản những hình ảnh mà đối tượng chính nhắm mắt.
Không đào tạo hình ảnh người đang chớp mắt, thuật toán deepfake ít có khả năng tạo ra khuôn mặt nhấp nháy bình thường. Khi chúng tôi tính toán tỷ lệ nhấp nháy tổng thể và so sánh với phạm vi tự nhiên, chúng tôi nhận thấy rằng các nhân vật trong video deepfake nhấp nháy ít thường xuyên hơn rất nhiều so với người thật. Nghiên cứu của chúng tôi sử dụng máy học để kiểm tra độ mở và đóng của mắt trong video .
[Hình minh họa: Daniel Salo]
Điều này đã cho chúng tôi nguồn cảm hứng để phát hiện các video deepfake. Sau đó, chúng tôi đã phát triển một phương pháp để phát hiện thời điểm người trong video nhấp nháy. Cụ thể hơn, nó quét từng khung hình của một video được đề cập, phát hiện các khuôn mặt trong đó, sau đó tự động định vị mắt. Sau đó, nó sử dụng một mạng lưới thần kinh sâu khác để xác định xem mắt được phát hiện đang mở hay đóng, sử dụng hình dạng, đặc điểm hình học và chuyển động của mắt. Chúng tôi biết rằng công việc của chúng tôi đang tận dụng một lỗ hổng trong loại dữ liệu có sẵn để đào tạo các thuật toán deepfake. Để tránh rơi vào con mồi của một lỗ hổng tương tự, chúng tôi đã đào tạo hệ thống của mình trên một thư viện lớn hình ảnh của cả mắt mở và mắt nhắm. Phương pháp này dường như hoạt động tốt và kết quả là chúng tôi đã đạt được tỷ lệ phát hiện trên 95%. Tất nhiên, đây không phải là lời cuối cùng để phát hiện ra những trò lừa đảo sâu. Công nghệ là cải thiện nhanh chóng và sự cạnh tranh giữa việc tạo và phát hiện video giả mạo tương tự như một trò chơi cờ vua. Đặc biệt, tính năng nhấp nháy có thể được thêm vào video deepfake bằng cách bao gồm hình ảnh khuôn mặt nhắm mắt hoặc sử dụng chuỗi video để đào tạo. Những người muốn gây nhầm lẫn cho công chúng sẽ tốt hơn trong việc tạo video sai sự thật – và chúng tôi và những người khác trong cộng đồng công nghệ sẽ cần tiếp tục tìm cách phát hiện chúng. Bài đăng này ban đầu xuất hiện trên The Conversation . Siwei Lyu là Phó Giáo sư Khoa học Máy tính và Giám đốc Phòng thí nghiệm Máy tính và Thị giác Máy tính tại Đại học Albany, Đại học Bang New York.
Nhận xét
Đăng nhận xét