
Bẫy siêu dữ liệu
Lớp dữ liệu tiết lộ cuộc sống của bạn
Siêu dữ liệu là gì và tại sao nó quan trọng?
Mọi văn bản, kiểm tra vị trí hoặc giao dịch blockchain đều để lại một dấu vết siêu dữ liệu — dữ liệu về dữ liệu của bạn. Không cần phải hiển thị nội dung để tiết lộ bạn là ai. Những thông tin bị tiết lộ có thể là bạn nói chuyện với ai, khi nào, ở đâu, tần suất thế nào, từ đó xây dựng một bức tranh rõ ràng về cuộc sống của bạn. Ví dụ, một bức ảnh của bạn trong một căn phòng trắng không tiết lộ nhiều cho đến khi siêu dữ liệu cho biết nó được chụp ở đâu, vào lúc nào và bằng thiết bị gì.

Những phát hiện chính từ báo cáo
Rất dễ dàng để thu thập siêu dữ liệu
Thu thập siêu dữ liệu rẻ hơn, nhanh hơn và dễ hơn so với theo dõi nội dung thực tế
Các ứng dụng hàng ngày làm rò rỉ thông tin của chúng ta
Các ứng dụng thể dục như Strava có thể vô tình tiết lộ địa điểm nhạy cảm và thói quen của người dùng
Siêu dữ liệu làm suy yếu quyền riêng tư của chúng ta
Các nhà hoạt động và nhà báo đặc biệt có nguy cơ bị theo dõi dựa trên siêu dữ liệu
Siêu dữ liệu làm mất tính ẩn danh của tiền mã hóa
Siêu dữ liệu blockchain có thể liên kết địa chỉ ví với danh tính thế giới thực.
Trí tuệ nhân tạo thúc đẩy giám sát siêu dữ liệu
Các hệ thống AI giờ đây tự động hóa việc nhắm mục tiêu dựa trên siêu dữ liệu, với những kết quả trí mạng
Thu thập siêu dữ liệu dễ dàng hơn so với giám sát nội dung
Nội dung thường được mã hóa và giám sát chúng khá tốn kém. Siêu dữ liệu thì không. Các cơ quan tình báo từ lâu đã ưa chuộng giám sát dữ liệu siêu dữ liệu vì nó tránh được nhiều biện pháp bảo vệ pháp lý áp dụng cho nội dung.
Các chương trình như PRISM và Stellar Wind của NSA đã thu thập siêu dữ liệu số lượng lớn (bao gồm nhật ký cuộc gọi, nhật ký IP và tiêu đề email) mà không cần lệnh. Khác với hình thức nghe lén toàn bộ, việc thu thập siêu dữ liệu có thể được chấp thuận theo các tiêu chuẩn lỏng lẻo hơn như nguyên tắc của bên thứ ba, giả định rằng người dùng đã từ bỏ quyền riêng tư khi họ chia sẻ siêu dữ liệu với nhà cung cấp dịch vụ.
Ngay cả sau khi Đạo luật TỰ DO Hoa Kỳ năm 2015 hạn chế việc thu thập dữ liệu hàng loạt trong nước của NSA theo Điều 215, hoạt động giám sát vẫn không dừng lại — nó chỉ thay đổi hình thức. Năm 2024, Thượng nghị sĩ Hoa Kỳ Ron Wyden tiết lộ rằng NSA hiện nay thường xuyên mua siêu dữ liệu từ các nhà môi giới dữ liệu thương mại. Các giao dịch mua bán này bao gồm lịch sử duyệt web và dữ liệu viễn thông của người Mỹ, được thu thập mà không có sự đồng ý của người dùng hoặc giám sát tư pháp.

Strava: Ứng dụng thể dục đã tiết lộ các căn cứ bí mật
Bản đồ nhiệt của một thiết bị theo dõi thể dục đã tiết lộ thói quen tập thể dục của mọi người và các căn cứ quân sự. Ngay cả siêu dữ liệu sức khỏe ẩn danh cũng có thể tiết lộ thông tin riêng tư khi kết hợp với thông tin vị trí công khai.
Strava, một ứng dụng thể dục phổ biến, thu thập một lượng lớn siêu dữ liệu GPS để theo dõi các lộ trình tập luyện của người dùng. Năm 2017, công ty đã công bố một bản đồ nhiệt toàn cầu dựa trên ba nghìn tỷ điểm GPS. Các nhà phân tích nhanh chóng phát hiện ra rằng bản đồ này vô tình tiết lộ sơ đồ các căn cứ quân sự của Hoa Kỳ, Nga và Thổ Nhĩ Kỳ tại các khu vực xung đột, chẳng hạn như Syria và Afghanistan. Mặc dù không có dữ liệu cá nhân nào bị tiết lộ trực tiếp, nhưng siêu dữ liệu tổng hợp đã tiết lộ các tuyến đường tuần tra, chu vi căn cứ và các khu vực hoạt động.
Gần đây hơn, vào năm 2022, các nhà báo từ Le Monde đã chỉ ra cách mà các tính năng xã hội của Strava có thể bị lợi dụng. Bằng cách tạo ra các tuyến đường chạy giả gần các căn cứ quân sự của Israel, họ đã kích hoạt chức năng “vận động viên gần đây” của Strava và thu thập siêu dữ liệu từ các hồ sơ bị lộ. Điều này cho phép họ nhận dạng các binh sĩ Israel, theo dõi thói quen của họ, và thậm chí quan sát các hoạt động ngoài căn cứ của họ trong đời sống dân sự.

TraceTogether: Ứng dụng COVID đã được sử dụng để giám sát
Tại Singapore, ứng dụng TraceTogether, được sử dụng để theo dõi COVID-19, đã được chuyển đổi sau này để phục vụ cho các cuộc điều tra hình sự. Đây là hồi chuông cảnh báo về việc siêu dữ liệu có thể bị lợi dụng nhanh như thế nào.
Ứng dụng TraceTogether của Singapore, được ra mắt trong thời kỳ đại dịch COVID-19, đã sử dụng một giao thức dựa trên Bluetooth có tên là BlueTrace để ghi lại một cách ẩn danh các mối liên hệ gần gũi giữa người dùng. Mặc dù ứng dụng hứa hẹn về quyền riêng tư thông qua việc xoay vòng ID và lưu trữ liên lạc tập trung, nhưng sau đó đã được tiết lộ rằng cơ quan thực thi pháp luật có quyền truy cập vào hệ thống. Vào năm 2021, Bộ trưởng Bộ Nội vụ Singapore đã thừa nhận rằng cảnh sát đã sử dụng dữ liệu TraceTogether trong ít nhất một cuộc điều tra hình sự, bao gồm cả một vụ án mạng.
Tiết lộ này trái ngược với những đảm bảo trước đó của chính phủ rằng dữ liệu sẽ chỉ được sử dụng cho mục đích y tế công cộng. Mặc dù người dùng được yêu cầu cung cấp thông tin cá nhân để kích hoạt ứng dụng, nhiều người vẫn tin rằng mình được ẩn danh và đã sử dụng ứng dụng, chỉ để sau đó nhận ra rằng cơ quan chính phủ có thể hủy ẩn danh siêu dữ liệu của họ.

Blockchain: không riêng tư như bạn nghĩ
Ngay cả các giao dịch ẩn danh cũng để lại siêu dữ liệu. Các công ty pháp y sử dụng các mẫu giao dịch, rò rỉ IP và phân tích mạng để liên kết ví với danh tính thật.
Mặc dù Bitcoin thường được coi là riêng tư, sổ cái công khai của nó ghi lại mọi giao dịch, tạo ra một nguồn siêu dữ liệu phong phú. Các công cụ phân tích pháp y như Chainalysis và Bitquery theo dõi mô hình giao dịch, rò rỉ IP và hành vi của ví để liên kết các địa chỉ giả danh với danh tính thật. Cơ quan thực thi pháp luật sử dụng chúng để điều tra các vụ án gian lận và rửa tiền. Tuy nhiên, những công cụ tương tự cũng có thể làm lộ danh tính của các nhà tố giác, nhà hoạt động hoặc bất kỳ ai dựa vào Bitcoin để bảo vệ quyền riêng tư.
Nghiên cứu học thuật cho thấy chỉ cần một vài điểm siêu dữ liệu để xác định danh tính người dùng. Trong một trường hợp, các nhà nghiên cứu đã xác định các cá nhân bằng cách liên kết các giao dịch Bitcoin với địa chỉ IP và các mẫu tái sử dụng ví. Các lỗ hổng bổ sung phát sinh từ siêu dữ liệu cấp độ mạng: nếu ví của người dùng kết nối với một tập hợp các node nhập đã biết hoặc rò rỉ thông tin IP trong quá trình phát sóng, người dùng có thể bị định danh ngay cả khi không có mã định danh từ tên riêng. Điều này phá vỡ giả định phổ biến rằng việc sử dụng các địa chỉ ví mới cho mỗi giao dịch mang lại tính ẩn danh thực sự.

AI hiện đang hỗ trợ nhắm mục tiêu dựa trên siêu dữ liệu
AI giúp tăng tốc phân tích siêu dữ liệu, hỗ trợ chính phủ và các bên tư nhân xác định, lập hồ sơ và nhắm mục tiêu cá nhân nhanh hơn bao giờ hết. Hoạt động giám sát xuất khẩu của Israel cung cấp cái nhìn tổng quan về những gì có thể và những gì đã xảy ra.
Tại Gaza, Israel được cho là đã triển khai các hệ thống AI như Lavender và The Gospel để tự động hóa việc ra quyết định quân sự dựa trên siêu dữ liệu. Lavender xử lý bản ghi điện thoại, dữ liệu định vị địa lý và biểu đồ xã hội để xác định những cá nhân có liên quan đến Hamas. Theo tạp chí +972, hệ thống có thể tự động tạo ra các mục tiêu tấn công với sự giám sát tối thiểu của con người, thường sử dụng siêu dữ liệu như mẫu cuộc gọi hoặc kết nối với cột phát sóng di động thay vì thông tin tình báo đã được xác nhận.
Gospel, một công cụ dựa trên siêu dữ liệu khác, được sử dụng để quyết định tòa nhà nào là mục tiêu, sử dụng bản đồ nhiệt được xây dựng từ dữ liệu điện thoại di động để ước tính sự hiện diện của dân thường. Các nhà phê bình, bao gồm Tổ chức Theo dõi Nhân quyền và các chuyên gia của Liên hiệp quốc, cảnh báo rằng loại tự động hóa này làm giảm ngưỡng sử dụng vũ lực chết người. Khi siêu dữ liệu được sử dụng mà không có bối cảnh đầy đủ hoặc trí tuệ của con người, thì những sai lầm rất dễ xảy ra và hậu quả có thể rất thảm khốc.

Làm thế nào để bảo vệ siêu dữ liệu của bạn
Các ứng dụng nhắn tin được mã hóa
Sử dụng các ứng dụng mã hóa đầu cuối giúp hạn chế lưu giữ siêu dữ liệu
VPN phi tập trung
Bảo vệ dấu vết kỹ thuật số của bạn với VPN và trình duyệt ưu tiên quyền riêng tư
Vô hiệu hóa tính năng theo dõi ứng dụng
Tắt theo dõi vị trí và cảm biến không cần thiết
Hãy đề phòng
Hãy suy nghĩ trước khi chia sẻ — siêu dữ liệu tiết lộ nhiều thứ về bạn hơn bạn nghĩ

