Viết bởi Justin McAfee, Nhà phân tích nghiên cứu, 1KX, được dịch bởi 0xxz@ Golden Finance
Sự xuất hiện của các nền tảng truyền thông xã hội do công ty kiểm soát, được thúc đẩy bởi động cơ thương mại, đã làm suy yếu rất nhiều hy vọng ban đầu về văn hóa tham gia trực tuyến. Công nghệ thông tin trực tuyến được cho là dân chủ hóa triệt để sản xuất văn hóa, nhưng ngày nay, các nền tảng này chủ yếu dành cho mục đích hướng đến lợi nhuận để hạn chế và định hình sự tham gia trực tuyến - “thích” không phải là dấu hiệu đánh giá cao cho một phần nội dung, mà là một công cụ kiếm tiền, một thuật toán định hướng kinh doanh.
Các nền tảng truyền thông xã hội thay thế dựa trên phân cấp và các giao thức liên kết cung cấp sự trở lại khái niệm ban đầu về xã hội hóa trực tuyến. Dữ liệu được kiểm soát bởi người dùng và phổ biến trong cơ sở dữ liệu phi tập trung, front-end hướng đến cộng đồng, tự giới hạn là biểu hiện của sở thích cộng đồng, thuật toán được người dùng lựa chọn và tinh thần nguồn mở thúc đẩy sự đổi mới.
Trước khi web trở thành một trung tâm kinh doanh, giải trí và tương tác xã hội, nó chủ yếu là một công cụ học thuật và quân sự. Tim Berners-Lee đã phát triển giao thức mạng đầu tiên với tầm nhìn bình đẳng - Internet ban đầu được thiết kế để trở thành một mạng phi tập trung, nơi thông tin có thể chảy tự do giữa các nút mà không có bất kỳ điểm kiểm soát hoặc lỗi nào.

Tuy nhiên, khi tầm quan trọng kinh doanh của web tiếp tục phát triển, các nền tảng tập trung như công cụ tìm kiếm và gã khổng lồ truyền thông xã hội đã trở nên thống trị. Mặc dù các thực thể này mang lại giá trị to lớn, nhưng chúng đi chệch khỏi tinh thần phân cấp ban đầu, dẫn đến môi trường web2 hiện tại của chúng ta.
Một sự đổi mới quan trọng trong việc thay thế cho dòng thời gian của các mạng xã hội là sự xuất hiện của khái niệm giao thức liên bang. Mạng liên kết là một hệ thống trong đó nhiều máy chủ độc lập hoặc “nút” làm việc cùng nhau để tạo thành một mạng xã hội duy nhất, thay vì một nền tảng tập trung nơi một tổ chức duy nhất kiểm soát tất cả các máy chủ.
Trong một hệ thống liên kết, mỗi máy chủ chạy phần mềm tương thích tuân theo một giao thức được chia sẻ, cho phép chúng giao tiếp với nhau. Người dùng đã đăng ký trên một máy chủ có thể theo dõi liền mạch người dùng trên các máy chủ khác, tương tác với người dùng trên các máy chủ khác và chia sẻ nội dung như thể họ đang ở trên cùng một nền tảng. Ví dụ về các giao thức này bao gồm ActivityPub và OStatus, cung cấp hỗ trợ cho các nền tảng liên kết như Mastodon và PeerTube.
Trong thiết lập liên kết, người dùng có thể chọn một máy chủ mà họ tin tưởng, có thể di chuyển sang một máy chủ khác hoặc thiết lập máy chủ của riêng họ, cho phép họ tự chủ hơn. Thuật ngữ “Fediverse” (sự kết hợp của “liên bang” và “vũ trụ”) được sử dụng để mô tả một hệ thống như vậy. Fediverse bắt đầu với các nền tảng như GNU Social và những người tiền nhiệm của nó (StatusNet và Laconica), nhưng bước ngoặt thực sự là sự phát triển và áp dụng rộng rãi giao thức ActivityPub, được phát hành theo khuyến nghị của World Wide Web Consortium (W3C) vào năm 2018.
Trong Web3, một khi dữ liệu được chuyển trên chuỗi, các mạng xã hội liên kết là trạng thái mặc định cho các hệ thống phi tập trung. Blockchain hoạt động như một máy chủ back-end trung lập với ý kiến lưu trữ nội dung và front-end lập chỉ mục nội dung này và phục vụ trực tiếp cho người dùng. Danh tính được xử lý bởi các cặp khóa công khai-riêng tư đã quản lý ví của người dùng, cho phép họ dễ dàng xác minh bất kỳ dữ liệu hoặc nội dung nào họ tạo ra. Ngoài ra, việc sử dụng các nguyên thủy trên chuỗi như NFT có thể gói nội dung được lưu trữ trong siêu dữ liệu và hoạt động như một tên miền hoặc mã định danh phi tập trung (DID).
Tương tự như cách ActivityPub hoạt động, giao thức web3 tìm cách khởi động biểu đồ xã hội thông qua các mối quan hệ được xác thực giữa các nút người dùng. Vì bất kỳ giao diện người dùng nào cũng có thể lập chỉ mục và phục vụ nội dung này, nên có sự cạnh tranh gay gắt trong lớp giao diện người dùng, dẫn đến các tính năng bùng nổ. Ngoài ra, vì dữ liệu nằm trên chuỗi, người dùng có thể chọn các thuật toán họ thích sử dụng và họ có thể được khuyến khích sử dụng các thuật toán nhất định, lấy lại giá trị của dữ liệu. Điều này, kết hợp với các phương tiện kiếm tiền từ nội dung đơn giản hơn, mang lại trải nghiệm tổng thể tốt hơn cho người sáng tạo, những người phần lớn bị loại trừ khỏi việc kiếm tiền mặc dù nội dung của họ thúc đẩy nhu cầu đối với các nền tảng này.
Để thực sự hiểu được những đổi mới trong các giao thức truyền thông xã hội phi tập trung, cần phải hiểu các sắc thái kỹ thuật của việc triển khai chúng.
Cần lưu ý rằng chúng tôi không bao gồm tất cả các giao thức xã hội ở đây, mà là chọn một số giao thức phổ biến nhất để so sánh: * Ma trận, Scuttlebutt, ActivityPub, Nostr, CyberConnect, Farcaster, Lens, Giao thức AT. **

Trong bối cảnh các biểu đồ xã hội hoặc giao thức mạng được liên kết và phi tập trung, “không gian tên” là một miền hoặc lĩnh vực nơi số nhận dạng người dùng hoặc tài nguyên khác là duy nhất. Đó là một cách để phân biệt tài nguyên hoặc danh tính của miền / máy chủ này với miền khác, đảm bảo rằng không có xung đột hoặc mơ hồ khi tích hợp hoặc giao tiếp trên nhiều miền.
Danh tính và không gian tên liên quan trong các giao thức xã hội phi tập trung bao gồm từ các cặp khóa đơn giản (Nostr, Scuttlebutt) đến URI trỏ đến hồ sơ lưu trữ URL HTTPS (ActivityPub) đến các mô hình phức tạp hơn sử dụng các nguyên thủy trên chuỗi như NFT (và gần đây là các tiện ích mở rộng ERC-6551 như Lens v2).
Farcaster là một ví dụ tuyệt vời về những kỹ thuật này. Tài khoản Farcaster đại diện cho một thực thể duy nhất trên mạng. Mỗi tài khoản có một số nhận dạng số duy nhất được gọi là ID Farcaster (“fid”). Danh tính được công bố và quản lý trên chuỗi bằng hợp đồng Ethereum có tên IdRegistry. Người dùng thực hiện giao dịch với IdRegistry để nhận fid mới. Địa chỉ sở hữu FID là địa chỉ lưu trữ của người dùng. IdRegistry đảm bảo rằng fids có thể được chuyển giữa các địa chỉ và không có hai địa chỉ nào có cùng fid. Farcaster cũng đã mở rộng không gian tên này để hỗ trợ các tên ENS được xuất bản trên chuỗi hoặc ngoài chuỗi. Bằng chứng về việc ký phải được gửi đến mạng để có được tên người dùng.
Mặt khác, ActivityPub xác định mỗi người dùng bằng một URI duy nhất, thường là URL HTTPS. URI trỏ đến hồ sơ của người dùng và đóng vai trò là mã định danh toàn cầu của họ trong Fediverse. Để làm cho các URI này thân thiện hơn với người dùng, nhiều nền tảng ActivityPub sử dụng một hệ thống gọi là Webfinger. Webfinger cho phép người dùng có danh tính như “@username@domain.com”.
**Lens và CyberConnect quản lý hồ sơ người dùng dưới dạng NFT. **Trong trường hợp của Lens, một địa chỉ người dùng có thể chứa một ProfileNFT và một địa chỉ duy nhất có thể chứa nhiều ProfileNFT. Mỗi NFT hồ sơ gói gọn toàn bộ lịch sử hoạt động của người dùng, bao gồm bài đăng, gương, nhận xét và các loại nội dung khác mà họ tạo. Ngoài ra, NFT hồ sơ có FollowModule, về cơ bản là một bộ quy tắc chi phối cách các tài khoản khác nhau có được NFT Theo dõi. Các NFT Theo dõi này được sử dụng để ghi lại kết nối giữa tài khoản và hồ sơ chính trực tiếp trên chuỗi. Ngoài ra còn có tên người dùng có thể tồn tại, có thể được tạo riêng biệt với hồ sơ và có thể được liên kết từ hồ sơ này sang hồ sơ khác hoặc hủy liên kết. Tên người dùng tồn tại trong không gian tên riêng của họ (ví dụ: ống kính/@alice).
Dữ liệu được cho là tính năng quan trọng nhất của các mạng phi tập trung, vì việc tạo và tiêu chuẩn hóa dữ liệu là nền tảng của các hệ thống này. Kỹ thuật phổ biến nhất để quản lý dữ liệu ở đây là sử dụng các định dạng chuẩn hóa như JSON và các đối tượng quan hệ phổ biến (ví dụ: “thích”, “theo”). Các đối tượng dữ liệu cốt lõi thường bao gồm:
Hãy đi sâu vào một vài ví dụ để xem nó hoạt động như thế nào bằng cách sử dụng một giao thức cụ thể.
ActivityPub tận dụng định dạng dữ liệu ActivityStreams 2.0, một cấu trúc dựa trên JSON, để đại diện cho các tương tác xã hội khác nhau, chẳng hạn như bài đăng hoặc lượt thích. Giao thức có hai thành phần chính: client-to-server (C2S) và server-to-server (S2S). C2S cho phép người dùng tương tác với các máy chủ tương ứng của họ thông qua các ứng dụng khách. Ngược lại, S2S tạo điều kiện giao tiếp giữa các máy chủ, cho phép sự mạnh mẽ của các giao thức liên kết.
Trong ActivityPub, các thực thể được phân loại là “người đóng góp” (thường là tài khoản hoặc nhóm người dùng) và “đối tượng” (nội dung hoặc hành động, chẳng hạn như bài đăng hoặc lượt thích). Khi người tham gia thực hiện một hành động trên một đối tượng, nó sẽ tạo ra một “hoạt động”, chẳng hạn như “Tạo”, “Theo dõi” hoặc “Thích”.
Biểu đồ xã hội Web3 lấy nhiều ý tưởng cốt lõi của ActivityPub nhưng áp dụng chúng trên chuỗi. Ví dụ: Lens Protocol đã giới thiệu “ấn phẩm” gói gọn nhiều nội dung do người dùng tạo, chẳng hạn như bài đăng, gương, bình luận và các hình thức truyền thông khác. Mỗi ấn phẩm được liên kết với một ContentURI trỏ đến nội dung cụ thể được lưu trữ trên một giao thức phi tập trung như IPFS hoặc Arweave hoặc một dịch vụ lưu trữ tập trung như AWS S3. Cấu hình này đảm bảo rằng hồ sơ của người dùng và tất cả các ấn phẩm liên quan được lưu trữ an toàn trong ví cá nhân của họ, giải phóng họ khỏi sự phụ thuộc vào cơ sở dữ liệu tập trung.
Ngoài ra, Web3 cung cấp một cách tiếp cận đơn giản hơn để kiếm tiền từ nội dung và ảnh hưởng của người dùng so với các khung Web2. Người dùng có thể tính phí đúc NFT Theo dõi hoặc tích hợp Mô-đun Thu thập với các ấn phẩm của họ. Tùy chọn thứ hai cho phép họ tính phí đúc cho các NFT được liên kết với ContentURI của ấn phẩm của họ. Ngoài các tính năng này, Lens Protocol cũng cung cấp API GraphQL để che giấu các thành phần blockchain khỏi giao diện front-end, cung cấp trải nghiệm thân thiện với người dùng hơn so với các nỗ lực trước đây tại các mạng xã hội phi tập trung.
Cuối cùng, nhiều giao thức mạng xã hội phi tập trung tạo ra các cấu trúc dữ liệu chỉ bổ sung được xác thực bằng khóa người dùng. Ví dụ: trên Cyber Connect, mỗi phần dữ liệu lấy người dùng làm trung tâm được thể hiện dưới dạng luồng dữ liệu, trong đó chỉ chủ sở hữu dữ liệu mới được phép cập nhật. Mỗi bản cập nhật cho dữ liệu được nối vào luồng dữ liệu dưới dạng cam kết chỉ có nhật ký có thể thêm và cấu trúc dữ liệu kết quả sẽ trở thành cấu trúc dữ liệu được liên kết băm được gọi là Merkle DAG. Các loại dữ liệu bao gồm nội dung, mục yêu thích, nhận xét và đăng ký.
Scuttlebutt được sử dụng tương tự để chỉ thêm các bản ghi. Mỗi người dùng có nhật ký riêng, trong đó mỗi tin nhắn hoặc hành động mới được nối vào cuối sau khi nó được ký bởi danh tính của người dùng (tức là cặp khóa ED25519 được liên kết). Nó cũng hỗ trợ chia sẻ dữ liệu nhị phân, được gọi là “blobs”. Đây có thể là hình ảnh, video hoặc bất kỳ nội dung nhị phân nào khác. Blob được lưu trữ riêng biệt với nhật ký chỉ bổ sung, nhưng tham chiếu (hàm băm) đến các blob đó có thể được bao gồm trong nhật ký.
Đối với Farcaster, tin nhắn được cập nhật công khai, chẳng hạn như đăng, theo dõi ai đó hoặc thêm ảnh hồ sơ, được mã hóa dưới dạng protobuf và phải được băm và ký bởi người ký tài khoản. Miễn là có đủ dung lượng lưu trữ, người dùng có thể đăng tin nhắn lên Hub. Hub kiểm tra tính hợp lệ của người ký trước khi chấp nhận từng tin nhắn.
Các phương pháp lưu trữ dữ liệu ban đầu cho các giao thức phi tập trung chủ yếu là ngoài chuỗi, mặc dù gợi nhớ đến sự đồng thuận trên chuỗi. Ví dụ: Scuttlebutt sử dụng mạng tin đồn ngang hàng đặt trách nhiệm lưu trữ trên thiết bị cục bộ của người dùng. Cách tiếp cận này đảm bảo chủ quyền dữ liệu vì người dùng có toàn quyền kiểm soát thông tin của họ. Tuy nhiên, điều này cũng có nghĩa là tính khả dụng của dữ liệu phụ thuộc vào việc thiết bị của người dùng đang trực tuyến hay một thiết bị ngang hàng khác trong mạng có bản sao dữ liệu. Theo thời gian, một số khách hàng của Scuttlebutt có thể cần thực hiện các chính sách thu gom rác để xóa dữ liệu cũ hoặc ít liên quan hơn để quản lý không gian lưu trữ.
Một giải pháp thay thế cho cách tiếp cận ngang hàng này xuất hiện dưới dạng các máy chủ lưu trữ dữ liệu, mặc dù có sự dư thừa so với các nền tảng truyền thông truyền thống. Trong trường hợp của Ma trận, nhiều máy chủ gia đình lưu trữ các bản sao của lịch sử phòng và đồng bộ hóa chúng với nhau. Khi người dùng gửi tin nhắn (hoặc bất kỳ sự kiện nào) trong phòng, máy chủ gia đình của họ sẽ phát sự kiện đến các máy chủ gia đình tham gia khác, sau đó lưu trữ sự kiện và chuyển tiếp sự kiện đến các máy khách được kết nối của họ. Tương tự, ActivityPub cho phép mỗi phiên bản (hoặc máy chủ) trong mạng lưu trữ dữ liệu của nó, thường là trong cơ sở dữ liệu. Việc lựa chọn cơ sở dữ liệu (quan hệ, NoSQL, v.v.) phụ thuộc vào việc triển khai cụ thể của phần mềm ActivityPub. Ví dụ: Mastodon, nền tảng ActivityPub phổ biến, sử dụng cơ sở dữ liệu PostgreSQL.
Các giao thức như CyberConnect, Farcaster và Lens sử dụng blockchain để lưu trữ. Việc sử dụng lưu trữ trên chuỗi đảm bảo tính bất biến và khả năng xác minh của dữ liệu, cung cấp nền tảng vững chắc cho các ứng dụng phi tập trung sử dụng cơ chế đồng thuận cơ bản để đồng bộ hóa trạng thái. Tuy nhiên, cách tiếp cận này có thể đưa ra những thách thức về khả năng mở rộng, vì mỗi phần dữ liệu cần được lưu trữ trên chuỗi, có khả năng dẫn đến phí giao dịch cao và thời gian truy xuất chậm hơn.
Điều này đã khiến nhiều giao thức xã hội web3 thử cách tiếp cận kết hợp, sử dụng lưu trữ trên chuỗi cho các hoạt động ít thường xuyên hơn (ví dụ: hồ sơ, đăng ký), lưu trữ ngoài chuỗi cho các sự kiện tần suất cao (ví dụ: thích, retweet, nhận xét) hoặc tải dữ liệu hàng loạt lên on-chain thường xuyên, sử dụng lưu trữ ngoài chuỗi như một biện pháp tạm thời.
Để xử lý hiệu quả các bản cập nhật thường xuyên giữa các kết nối người dùng, CyberConnect sử dụng các danh sách được liên kết băm trong một kho dữ liệu phi tập trung. Khi bạn bắt đầu kết nối, một “nhật ký hoạt động” sẽ được tạo. Thay đổi trạng thái tiếp theo, chẳng hạn như chuyển đổi giữa theo dõi và hủy theo dõi, được thêm vào nhật ký này dưới dạng nút mới. Mặc dù các bản cập nhật này ban đầu được lưu trữ trên các máy chủ tập trung, nhưng chúng thường xuyên được tải lên hàng loạt lên các nền tảng lưu trữ phi tập trung như Arweave hoặc IPFS. Để nhanh chóng truy xuất dữ liệu, các nút trong nhật ký hoạt động được lưu trữ tập trung. Tuy nhiên, người dùng có thể xác minh độc lập tính toàn vẹn dữ liệu bằng cách duyệt danh sách các liên kết băm này. Mặc dù một số truy vấn dữ liệu dựa trên một máy chủ trung tâm, hệ thống của CyberConnect được thiết kế để phân cấp hoàn toàn đồng thời mang lại hiệu suất cao.
Farcaster tương tự sử dụng cách tiếp cận lai: hợp đồng trên chuỗi được sử dụng cho các hoạt động không thường xuyên, trong đó tính nhất quán và phân cấp là quan trọng. Tài khoản, tên người dùng, lưu trữ và khóa được quản lý bằng một loạt các hợp đồng Ethereum. Các hệ thống ngoài chuỗi được sử dụng cho các hoạt động thường xuyên trong đó hiệu suất là rất quan trọng. Tin nhắn được tạo bởi tài khoản người dùng được lưu trữ và lan truyền trên mạng ngang hàng trong trung tâm Farcaster.
Các giao thức xã hội phi tập trung dự kiến sẽ cách mạng hóa trải nghiệm người dùng trong các tương tác kỹ thuật số. Được thúc đẩy bởi web3 và như một biện pháp chủ động chống lại nội dung do AI tạo ra, việc tăng tốc áp dụng các cặp khóa công khai-riêng tư sẽ góp phần hiểu biết rộng hơn và quen thuộc hơn với các nguyên thủy nhận dạng trong bối cảnh này và việc tiếp tục kiểm duyệt và thu thập dữ liệu của các công ty truyền thông xã hội web2 sẽ công khai đẩy nhiều người dùng đi nơi khác. Chúng tôi hy vọng đường cong áp dụng của các giao thức này sẽ tăng tốc.
Để tạo điều kiện thuận lợi cho sự phát triển của các ứng dụng mới, có một nhu cầu cấp thiết cho các nhà phát triển giao thức và những người đóng góp nguồn mở vượt ra ngoài các kiểu dữ liệu cơ bản và các đối tượng quan hệ hiện đang được sử dụng bởi các lớp cơ sở hạ tầng. Mặc dù các nguyên thủy hiện tại gói gọn đầy đủ các khả năng của phương tiện truyền thông xã hội web2 truyền thống, nhưng vẫn có tiềm năng to lớn để mở rộng và đổi mới. Hầu hết các giao thức được thảo luận ở đây vốn đã hỗ trợ khả năng mở rộng trong hệ thống của họ, cung cấp một nền tảng vững chắc cho sự phát triển trong tương lai và đóng góp nguồn mở.
Tuy nhiên, điều quan trọng là phải nhấn mạnh tầm quan trọng của khả năng tương tác. Mặc dù các nhà phát triển front-end có thể tăng cường các tính năng một cách độc lập, nhưng làm như vậy có thể gây hại cho lợi ích chung của hệ thống nếu các cải tiến không tương tác với các ứng dụng khác được xây dựng trên cùng một giao thức cơ bản. Đảm bảo tính tương thích và tích hợp liền mạch giữa các ứng dụng khác nhau là rất quan trọng đối với sự thành công lâu dài và việc áp dụng các giao thức xã hội phi tập trung.
Trong thế giới lưu trữ dữ liệu, sự đồng thuận mới nổi trong các giao thức xã hội web3 có xu hướng sử dụng cách tiếp cận lai. Với mức độ tương tác và nội dung xã hội cao, việc phân bổ các tài sản có giá trị cao như danh tính và nội dung cho các nguyên thủy trên chuỗi là thực tế, đồng thời gán nội dung rủi ro thấp như lượt thích và phản ứng cho các giải pháp ngoài chuỗi. Cách tiếp cận cân bằng này không chỉ bảo vệ tính toàn vẹn và bảo mật của dữ liệu quan trọng mà còn cung cấp trải nghiệm người dùng gợi nhớ đến các nền tảng truyền thông xã hội truyền thống.
Các mạng phi tập trung hứa hẹn sẽ chuyển đổi giao tiếp của con người, chia sẻ thông tin và xây dựng cộng đồng. Bằng cách ưu tiên quyền tự chủ của người dùng, quyền riêng tư và nuôi dưỡng các mối quan hệ hữu cơ, các mạng này đang mở đường cho một môi trường kỹ thuật số công bằng và lấy người dùng làm trung tâm hơn. Ngoài ra, bản chất phi tập trung của các mạng này giúp dân chủ hóa quyền truy cập vào thông tin và tài nguyên, giảm thiểu rủi ro liên quan đến kiểm soát tập trung.