Vậy tại sao chúng ta vẫn duy trì sử dụng một internet bị giám sát?

Thuở sơ khai của Internet, Chiến tranh Lạnh, và các nguồn gốc quân sự-thương mại của nó

linkedin_graduação.jpg
Pedro SydenstrickerNhà sáng tạo cộng đồng
2 phút đọc
Pablo: Improve quality
Chia sẻ

Tại sao không ai nói về siêu dữ liệu

Ngày càng có nhiều chiến dịch quảng bá về bảo mật dữ liệu. Từ các công ty khởi nghiệp đến những gã khổng lồ công nghệ, ta dễ dàng thấy những công nghệ được truyền thông là bảo vệ quyền riêng tư người dùng, như mã hóa đầu-cuối trong các sản phẩm như WhatsApp hay Google Drive.

Tuy nhiên, cốt lõi của giám sát lại nằm ở một yếu tố ít được đề cập: phân tích siêu dữ liệu.

Vậy, siêu dữ liệu thực sự là gì? Siêu dữ liệucác thông tin kỹ thuật và mô tả về giao tiếp số. Chúng bao gồm địa chỉ IP nguồn và đích, thời gian truyền tải, kích thước gói dữ liệu và chỉ báo trạng thái kết nối (flag).

Thoạt nhìn, những chi tiết này có vẻ vô hại. Nhưng khi được thu thập trên quy mô lớn, chúng có thể tạo nên hồ sơ cực kỳ chi tiết về từng cá nhân hoặc nhóm — tiết lộ các mô hình nhạy cảm như: vị trí, thói quen hàng ngày, các mối quan hệ, và sở thích cá nhân hay nghề nghiệp. Trên thực tế:

“Siêu dữ liệu sẽ cho bạn biết mọi thứ về cuộc sống của ai đó. Nếu có đủ siêu dữ liệu, bạn thực sự không cần biết nội dung." — Stewart Baker, cựu Cố vấn tổng của Cơ quan An ninh Quốc gia Hoa Kỳ

Siêu dữ liệu là gì?

Ngoài ra, điều quan trọng cần lưu ý là mã hóa đầu cuối không đảm bảo tính ẩn danh của siêu dữ liệu.

Trên thực tế, siêu dữ liệu của bạn bị lộ theo cấu trúc trong kiến trúc mạng internet hiện tại. Nhưng ai đã quyết định thiết kế kiến trúc này?

Chiến tranh Lạnh và thuở sơ khai của internet

Internet ban đầu là một thí nghiệm hợp tác giữa một số trường đại học ở Hoa Kỳ và Bộ Quốc phòng Mỹ.

Vào năm 1971, ARPANET (tiền thân của internet) có mười lăm điểm kết nối. Mục tiêu chính của mạng này rất đơn giản: kháng cự lại một cuộc tấn công có thể xảy ra của Liên Xô vào hệ thống thông tin liên lạc của Mỹ, vốn phụ thuộc nhiều vào mạng điện thoại.

ARPANET được tài trợ bởi chính phủ Mỹ và được quản lý bởi Cơ quan Dự án Nghiên cứu Tiến tiến (ARPA).

Khác với mục đích thương mại và giải trí rộng rãi mà internet nhiều thập kỷ sau đó, ARPANET có những mục tiêu quân sự rõ ràng: bảo mật hoạt động, độ tin cậy và khả năng chống lại các cuộc tấn công cao. Các ưu tiên chiến lược này đã tác động sâu sắc đến các công nghệ và quyết định kiến trúc của mạng.

Nguyên liệu bí mật: Chuyển mạch gói

Một trong những đổi mới công nghệ chính trong sự phát triển của ARPANET là chuyển mạch gói, được phát triển đồng thời bởi Paul Baran (Mỹ) và Donald Davies (Vương quốc Anh).

Ý tưởng phá vỡ tin nhắn thành những gói nhỏ hơn có thể di chuyển độc lập qua các tuyến đường khác nhau để đến đích cuối cùng. Nếu một tuyến đường bị chặn hoặc bị phá hủy, các gói khác vẫn có thể đến đích bằng cách sử dụng các con đường thay thế. Việc loại bỏ sự phụ thuộc vào một đường dẫn tập trung duy nhất, công nghệ chuyển mạch gói đã giảm thiểu khả năng mất gói và sự cố liên lạc  nhắm  thực hiện mục tiêu quân sự là xây dựng một hệ thống giao tiếp vững chắc chống lại mối đe dọa từ Liên Xô.

Tuy nhiên, chính công nghệ này đã phơi bày siêu dữ liệu của chúng ta. Để một gói thông tin có thể di chuyển trong mạng và tìm đến đích cuối cùng, siêu dữ liệu phải được lộ ra mà không được mã hóa trong phần tiêu đề của các gói thông tin. Nói cách khác, cái nôi của việc phơi bày cấu trúc của dữ liệu siêu dữ liệu của chúng ta liên quan đến cách mà chuyển mạch gói hoạt động – bên cạnh đó, tất nhiên, là cách mà hạ tầng mạng được vận hành. Nhưng chúng ta sẽ quay lại vấn đề đó sau.

Các tích hợp công nghệ: Điện thoại, radio và vệ tinh

Ban đầu, ARPANET sử dụng hạ tầng mạng điện thoại sẵn có của Mỹ. Mặc dù có tính thực tiễn và tối ưu về chi phí, điều này sớm tiết lộ những giới hạn về địa lý và vận hành.

Để mở rộng phạm vi và khả năng, ARPANET đã bắt đầu khám phá các công nghệ mới như: liên lạc qua radiovệ tinh. Vào những năm 1970, dự án Alohanet đã cố gắng kết nối các hòn đảo của Hawaii qua radio. Sự can thiệp tín hiệu đã gợi ý Robert Metcalfe phát triển một hệ thống chờ trước khi truyền lại các gói tin  —  một phương pháp sau đó đã phát triển thành tiêu chuẩn Ethernet, thay thế radio bằng cáp vật lý cho các mạng cục bộ.

Đồng thời, công nghệ vệ tinh đã thúc đẩy mạnh mẽ viễn thông toàn cầu. Vệ tinh cho phép truyền tải dữ liệu đường dài đáng tin cậy, phù hợp với các mục tiêu chiến lược và quân sự của Hoa Kỳ. Đến giữa thập niên 70, ARPA đã vận hành ba mạng thử nghiệm khác nhau:

  • ARPANET (đường dây điện thoại)
  • PRNET (radio)
  • SATNET (tuyến vệ tinh)

Nhu cầu cấp bách phải tích hợp các mạng này đã dẫn đến sự ra đời của giao thức TCP/IP bởi Vint Cerf, Jon Postel, và Danny Cohen.

Giao thức TCP/IP

Giao thức TCP/IP có hai phần chính:

  1. TCP (Giao thức điều khiển truyền tải): Quản lý các kết nối điểm-đến-điểm, đảm bảo việc chuyển giao gói tin được an toàn và có trật tự
  2. IP (Giao thức Internet): Xử lý việc truyền tải các gói tin qua các mạng khác nhau

Cấu trúc này giới thiệu một hệ thống phân cấp rõ ràng:

  • Cấp độ mạng (xác định mạng mà người dùng đang kết nối)
  • Cấp độ máy chủ (xác định thiết bị cụ thể trong mạng đó)

Ngoài ra, việc tạo ra cổng kết nối (thiết bị kết nối các mạng khác nhau và điều hướng luồng dữ liệu giữa chúng) là điều cần thiết để kết nối các mạng cục bộ trong cấu trúc phân cấp này.

Cấu trúc kỹ thuật này đã phơi bày một lượng thông tin người dùng đáng kể – vốn được nhúng có cấu trúc trong kiến trúc của internet. Mỗi địa chỉ IP có thể tiết lộ các chi tiết quan trọng như vị trí địa lý tương đối, tổ chức hoặc nhà cung cấp dịch vụ internet, và loại thiết bị đang được sử dụng.

Để hoạt động hiệu quả, giao thức TCP/IP yêu cầu một lượng lớn siêu dữ liệu, bao gồm các dấu thời gianflags hiển thị trạng thái kết nối.

Các nhà thiết kế Internet về cơ bản đã áp đặt việc phơi bày dữ liệu này như một điều kiện tiên quyết để truy cập mạng – tất cả đều được chính phủ Mỹ đầu tư mạnh tay để mở rộng TCP/IP trên toàn cầu.

Vậy tại sao chúng ta vẫn duy trì sử dụng một internet bị giám sát?

Bởi vì, về mặt chiến lược, đối với các tổ chức dân sự và quân sự xây dựng internet, thì việc biết ai đó kết nối với ai, khi nào, ở đâu và như thế nào là điều hữu ích. Tất nhiên, còn vì các lý do thương mại khác nữa.

Sự áp dụng rộng rãi của Internet

Internet trở nên phổ biến không phải nhờ một tác nhân duy nhất hay một kế hoạch tập trung. Nó là kết quả từ sự hội tụ của nhiều lực lượng tổ chức, chính trị, thương mại và xã hội.

Vào những năm 1980 và 1990, mạng lưới đã phát triển từ một thí nghiệm quân sự-học thuật dựa vào Hoa Kỳ thành một cơ sở hạ tầng toàn cầu được định hình bởi những lợi ích và tầm nhìn cạnh tranh.

Ban đầu, quyền truy cập vào ARPANET bị hạn chế cho một số trường đại học ở Mỹ được ARPA tài trợ. Điều này gây ra áp lực đòi hỏi dân chủ hóa quyền truy cập, đặc biệt thông qua Quỹ Khoa học Quốc gia (NSF), cơ quan đã bắt đầu xây dựng mạng riêng của mình vào năm 1984.

Khi NSF tích hợp mạng lưới của mình với ARPANET, hầu như tất cả các trường đại học ở Mỹ đều có quyền truy cập vào Internet, mở ra cánh cửa cho Internet dân sự. Đây là một bước ngoặt quan trọng: Internet bắt đầu mở rộng một cách phi tập trung, với người dùng tạo ra các mạng cục bộ (LANs) được kết nối với hạ tầng rộng hơn.

Để hỗ trợ sự phát triển này, Hệ thống Tên miền (DNS) đã được tạo ra. DNS phi tập trung quản lý địa chỉ máy chủ bằng cách chỉ định các máy chủ phụ trách các tên miền khác nhau như .edu, .gov, .mil, .com, .org, và .net. Điều này giúp Internet phát triển và củng cố cấu trúc phân cấp, quốc tế của nó.

Tuy nhiên, một vấn đề lớn đã phát sinh: luật pháp Hoa Kỳ cấm sử dụng cơ sở hạ tầng công cộng cho mục đích thương mại.

Trong thời gian NSF quản lý, việc sử dụng Internet bị giới hạn cho giáo dục và nghiên cứu. Nhưng nhu cầu gia tăng và áp lực từ khu vực tư nhân đã dẫn đến việc tư nhân hóa cơ sở hạ tầng internet.

Bắt đầu từ năm 1991, các Nhà cung cấp dịch vụ Internet (ISPs) đầu tiên xuất hiện, đánh dấu việc thương mại hóa của web. Các công ty tư nhân bắt đầu quản lý mạng vật lý  —  cáp, thiết bị chuyển mạch và máy chủ  —  cung cấp kết nối TCP/IP đến người dùng cuối (và cũng thu thập tất cả siêu dữ liệu của người dùng).

Vì vậy, từ những năm 90, Internet dân sự không còn là một nền tảng giáo dục/khoa học mà đã trở thành một không gian tiêu dùng, giải trí, giao lưu xã hội và thể hiện bản thân phù hợp với cách sử dụng web hiện đại.

Suy ngẫm lại về nền tảng kỹ thuật của internet

Việc hiểu nguồn gốc lịch sử của Internet giúp lý giải vì sao nó phơi bày nhiều siêu dữ liệu như vậy, và tại sao nó không được thiết kế với quyền riêng tư cá nhân làm trọng tâm.

Trên thực tế, di sản lịch sử này đã hạn chế đáng kể khả năng bảo vệ quyền riêng tư trực tuyến ngày nay. Tuy nhiên, thay vì đổ lỗi cho lịch sử, câu hỏi thực sự nên là: Tại sao cơ sở hạ tầng này đến nay vẫn chưa được thay đổi?

Cho đến nay, siêu dữ liệu vẫn tiếp tục bị rò rỉ ở cấp độ mạng, phơi bày thông tin nhạy cảm của người dùng cho các chính phủ, công ty tư nhân và tội phạm mạng.

Mạng lưới ẩn danh Layer-0, như Mixnet Tạo Nhiễu của NymVPN - một bước tiến vượt bậc so với thiết kế mạng hiện nay đã lỗi thời của Tor, là những công nghệ mới quan trọng trên thị trường có khả năng làm xáo trộn siêu dữ liệu nhằm bảo vệ thông tin người dùng và mô hình lưu lượng truy cập ở tầng mạng.

Nếu quyền riêng tư không phải là nguyên lý sáng lập của internet, thì thế hệ ngày nay phải biến nó thành một nguyên tắc nền tảng.

Nếu quyền riêng tư không phải là nguyên lý sáng lập của internet, thì thế hệ ngày nay phải biến nó thành một nguyên tắc nền tảng.

Earlybird-email banner (1).webp

Giám sát Internet: Các câu hỏi thường gặp

Quản trị Internet đã chuyển từ các mạng học thuật do NSF quản lý sang các ISP tư nhân hóa, những ISP này ghi lại lưu lượng truy cập nhằm mục đích thương mại hóa và thực thi pháp luật—nhúng tính năng thu thập siêu dữ liệu hàng loạt vào cốt lõi của cơ sở hạ tầng.

Các kỹ thuật như ghi nhật ký TCP/IP, DPI và giám sát mạng lưới tập trung xuất phát từ nghiên cứu quân sự, và tác động của chúng vẫn tồn tại trong các hệ thống giám sát mạng ngày nay.

Siêu dữ liệu—như dấu thời gian, địa chỉ IP và nhật ký định tuyến—có thể tiết lộ các mối liên kết và mẫu theo thời gian, thường không cần giải mã thông tin liên lạc.

Mixnet phá vỡ khả năng liên kết liên tục bằng cách gom các tin nhắn theo nhóm, đưa lưu lượng truy cập ẩn và sắp xếp lại các gói tin, khiến việc theo dõi nguồn gốc của lưu lượng truy cập trở nên gần như không thể.

Họ là các nhà thu thập dữ liệu chính—ghi lại siêu dữ liệu lưu lượng truy cập của thuê bao, giới hạn băng thông truy cập hoặc bán hồ sơ sử dụng—và đóng vai trò như những điểm chiến lược quan trọng đối với cả cơ sở hạ tầng giám sát của nhà nước và doanh nghiệp.

Giới thiệu các tác giả

linkedin_graduação.jpg

Pedro Sydenstricker

Nhà sáng tạo cộng đồng
Pedro là một thành viên của cộng đồng Nym và là đồng sáng lập của TupiNymQuim squad. Là một nhà phát triển phần mềm và nhà hoạt động bảo mật thông tin, anh ấy đã có nhiều bài chia sẻ về công nghệ, quyền riêng tư và xã hội.

Mức giá thấp mới

VPN riêng tư nhất thế giới

Hãy dùng thử NymVPN miễn phí

Tiếp tục đọc...

Nym Network Blog Image

VPN và mixnet: Sự kết hợp cộng hưởng sức mạnh

Gần một phần ba số người trên toàn thế giới đã sử dụng Mạng riêng tư ảo (VPN)

1 mins read