区块链网站|NFTS Filecoin(FIL) Web 3.0需要去中心化存储 但是Filecoin有很多必须注意的缺陷

Web 3.0需要去中心化存储 但是Filecoin有很多必须注意的缺陷

广告位

Web 3.0 需要去中心化存储,但 Filecoin 还有不少缺陷必须关注

平行投资公司副总裁李硕淼弗兰克

大家都在谈论的Web3.0到底是什么?

互联网发展至今,经历了Web1.0和Web2.0两个阶段,Web1.0网站多为静态网站,网络用户与网络信息之间没有交互过程。用户只能获取网络上显示的信息,信息获取的有效性和效率相对较低。

随着网速和带宽的提高,人和互联网逐渐开始互动。2003年,奥莱利媒体公司的副总裁戴尔多尔蒂提出了Web2.0的概念

Web2.0被称为读写网。Web2.0初期,与Web1.0相比,所有网络用户都可以创建自己的内容并上传到网络,而不仅仅是从网络获取信息,这大大增加了网络信息的丰富性。随着近年来AI、大数据等技术的进一步发展,人机交互被提升到一个新的阶段。捕捉并记录用户在互联网上产生的浏览信息、点击、搜索等在线行为数据。技术后台通过结合用户的实时数据和其过往信息,可以分析出更加精准的用户画像,并根据用户画像为用户推荐相应的产品或信息。这样提高了商家的购买转化效率,同时用户也可以更快的找到自己可能想要购买的商品,让用户体验变得更好。

但是信息集中化虽然方便,但是也有一个很大的弊端,就是用户的所有数据都是在用户没有感知的情况下被平台手机使用,甚至数据的归属都是模糊的。

在Web1.0和Web2.0的早期,由于用户数据量小,数据维度相对较小,用户的个人数据无法产生太大的价值。然而,近年来,随着人们使用互联网的比重越来越大,互联网上个人信息的价值也不容忽视。近两年,各国都出现了互联网公司侵犯个人隐私数据、窃取用户数据的案例。随着未来人工智能物联网(AIoT)和5G网络的发展,个人网络数据的维度将更加全面和有价值,使得数据安全和数据隐私变得更加重要。

Web3.0的出现就是为了解决Web2.0目前面临的问题。区块链网络由于其去信任、不可篡改、可确认的功能和性质,很好地满足了作为Web3.0底层技术的要求,同时由于网络架构的改变,数据不再是简单的数字而是具有价值属性的商品,我们现有的数据网络也慢慢转变为价值网络。

Web3.0需要去中心化存储。

如前所述,如果你想构建一个去中心化的网络来保证数据的安全性和隐私性,你需要保证数据只能由它的所有者(数据生产者)控制,这包括获取或授权他人使用的权利。遗憾的是,目前互联网所有的存储方案都是集中式存储,主要的存储提供商是亚马逊、阿里云、谷歌云等中心组织。与此同时,用户在网上产生的个人数据,现在也被各种平台和app占据。即使未来可以将个人数据的所有权归还给用户本人,但在集中存储的条件下,用户也无法保证自己的数据不会被app平台甚至存储提供商使用或修改。

此外,5G、AIoT等前沿技术发展迅速。未来,网络中个人数据的维度将进一步增加,数据的价值也将快速提升。只有分散存储才能进一步保证数据的安全性和私密性。

如果没有分散存储技术作为分散网络的底层技术支撑,即使实现了分散的信息传输和分散的计算,也无法真正保证数据的分散。因此,去中心化存储将是未来Web3.0生态系统中必不可少的技术组件。

传统云存储的现状

目前传统云存储领域可以分为公有云、私有云、混合云三种形式。公共云是目前最常见的云服务形式。它由技术提供商拥有和管理,为许多客户提供服务。同时,公有云可以分为三种技术形态:SaaS、PaaS和IaaS。

SaaS是“软件即服务”的缩写。这种服务将应用作为服务提供给用户,主要客户是个人家庭用户和中小型企业用户。国内主要的服务商是百度网盘、腾讯魏云,国外主要是Dropbox、iCloud等。

PaaS是“平台即服务”的缩写。这种服务将开发平台作为服务提供给用户,客户主要是中小企业和个人开发者。中国的头部PaaS平台有百度云,国外的Openshift平台主要是针对Google App Engine和红帽开发的。

IaaS是“基础设施即服务”(Infrastructure as a service)的简称,主要是将虚拟机、云存储原件等云计算资源作为服务网络提供给用户。国内头部企业有阿里云、华为云,国外主要由亚马逊EC2提供此类服务。

与公有云不同,私有云、混合云大多服务于大型企业用户。私有云由企业或组织使用和维护,用户对个性化有更多的控制权。混合云是一种混合搭配公有云和私有云的解决方案,可以实现相对较高的性价比。

首先可以分析一下国内个人用户使用云存储的数据:根据极光2019年的MAU份额数据,前四名分别是百度网盘、腾讯魏云、蔡赟和天翼云盘。

其中,百度网盘活跃用户份额达到82.9%。继续观察百度网盘的用户兴趣爱好TGI,可以得出用户存储的主要数据是电影、动漫、体育相关内容。

就公司层面而言,数据显示,目前有39%的企业在使用云存储相关服务(如AWS、Azure、Google Cloud等。).根据预测,到2022年,使用云存储相关服务的企业数量将达到60%左右。在美国三大云存储公司中,微软Azure的市场份额为44%,AWS约为32%,谷歌云仅为19%。Azure还被Spiceworks2019公共云报告评为最具竞争力的云服务提供商。同时,根据调查,79%的企业主在业务中主要使用Windows系统,微软的Azure云存储服务使用Windows系统的产品体验更好。

目前云存储服务架构已经比较成熟,用户可以根据自己的需求选择使用公有云、私有云或者混合云服务。其中,在公有云服务中,用户可以根据数据调用的频率选择不同的存储方式,在不影响使用的情况下,最大程度的节约成本。

与云存储相比,近81%的企业仍在使用传统的存储矩阵,即硬件存储。目前,戴尔EMC的市场份额最高,为42%。据调查,80%的企业选择传统存储矩阵是因为其可靠性更高,他们还认为与云存储相比,传统硬件存储具有更高的隐私性和安全性。

在技术层面,传统云存储经历了三次迭代。第一阶段是基于NAS(网络附加存储)和SAN(存储区域网络)的存储架构方案。这种架构初步形成云存储方案,但由于服务器地理位置较高,难以灵活调用不同的存储集群,因此在容量和性能扩展上存在较大瓶颈。

第二阶段的开始以EMC VPLEX体系结构的出现为标志。VPLEX在原有存储架构的基础上,实现了虚拟存储和异构存储的功能,解放了存储硬件的地域限制,解决了跨集群操作问题。通过集成智能分布式缓存,可以跨主机、集群、数据中心访问和共享数据,大大提高了云存储的容量和可扩展性。它的服务类似于IAAS现在提供的服务。

第三阶段是当前云存储所在的阶段。目前的云存储基础设施具有类似云的结构,多个存储设备相互连接,根据不同的需求智能切换硬件设备。同时,在原有的基础上,多副本的一致性、容灾性、灵活扩展性都有了很大的提高。目前,云存储的SaaS和PaaS平台可以为用户提供简单易用的存储服务。

分散存储的发展

在当前的云存储基础架构中,分布式架构以其高性能、一致多分布、支持分层存储等优势成为标准。分散存储实际上可以归类为分布式存储的一种。

与其他分布式存储方案相比,分散存储架构中的数据中心不会完全归云提供商所有,而是由网络中的多个节点共同提供,数据以加密的方式存储。这样就可以更好的解决数据的私密性和安全性,即使是数据中心或者存储硬件提供商也无法获取存储的数据。

目前,分散存储最具代表性的项目是IPFS和Filecoin。IPFS被称为“星际文件系统”,它的中文名字是“星际文件系统”。IPFS是一种底层网络传输协议,相当于当前互联网世界中的HTTP(超文本)协议。HTTP是一个简单的请求-响应协议,用于用户和服务器之间的交互。

IPFS的功能与HTTP类似,但加入了p2p网络的架构特点。与HTTP协议相比,IPFS协议效率更高。HTTP是单线程通信,一个服务器上一次只能执行一个任务,而IPFS采用p2p进行多线程下载,可以节省50%以上的带宽成本。同时,由于目前互联网服务器的集中性,网络中的信息可以完全被控制,难以保存。然而,如果使用分散式协议,如IPFS,只要网络中的任何用户拥有该信息,整个网络就可以获得该信息。

在去中心化存储生态系统中,IPFS主要扮演底层技术协议的角色,其他具体的业务端解决方案将由layer2项目实现。目前,IPFS团队开发的激励层Filecoin最有可能是第一个基于IPFS协议的激励层。这个项目已经启动了测试网,最快今年就会启动主网。

除了IPFS,还有很多项目在尝试分散存储,但目前没有实际进展,就不做过多介绍了。

读取Filecoin

Filecoin是基于IPFS协议的去中心化存储项目,在用户和存储服务提供商之间搭建桥梁,为用户提供去中心化存储服务。

Filecoin网络的参与者可以分为三部分:存储矿工、检索矿工和用户。存储矿工为去中心化的存储网络提供存储空间,同时在网络中抵押一些代币,防止矿工作恶。存储挖掘者需要向网络证明他们在特定时间内存储了用户的目标数据。如果没有,将扣除一定比例的抵押代币作为惩罚。

搜索矿工主要负责为网络中的用户提供数据搜索服务。当用户发起需求时,搜索矿工需要在网络中找到相应的信息并发送给用户。同时,网络对矿工的参与没有要求。挖掘者可以同时是存储挖掘者和检索挖掘者,也可以只参与其中的一个。

用户在使用Filecoin时也有了更大的灵活性。一方面,用户可以将Filecoin网络作为网盘使用。用户只需注明想要存储的数据和报价,系统会将用户的报价与矿工的报价进行匹配。价格统一后,系统将用户的数据发送给存储矿工。

存储矿工根据数据的大小,将其放入不同的扇区(存储单元),然后对扇区进行封装和切片,交易信息将存储在网络中的哈希表中。在订单的连续处理过程中,节点会不断挑战矿工,检查矿工是否保存了这个文件。这样就完成了整个存储的过程。

在数据隐私方面,用户可以在创建存储订阅时选择其存储的数据是仅支持个人查看还是对全网开放。如果向全网公开,那么全网每个人都可以通过搜索矿工来查询这个数据。用户数据存储在几个不同的节点中。

在共识算法方面,Filecoin使用了三种不同的共识算法:预期共识、复制证明和时空证明。

期望一致性是Filecoin中用来指定块规则的一致性算法,是一种基于概率的拜占庭容错算法。按照预期的共识,每产生一个新的区块,就要选举出负责区块的领导者。类似于BTC矿业,被选中的概率与整个网络中计算能力的比例成正比,但在Filecoin网络中,是根据矿工提供的有效存储空间而不是BTC网络中的计算能力来计算的。在网络的每个区块生成之前,矿工会根据前一个区块的票值,通过VRF和VDF的线性过程生成一个newticket,然后通过比较newticket的值和整个网络的有效计算能力与最终能力的比值,来确认自己是否有资格获得该区块。如果newticket小于其有效计算能力/网络计算能力,则该挖掘器被选为块挖掘器。

与BTC网不同的是,Filecoin的选举方式可能会导致没有人出块或者很多人一起出块当领袖的情况。当没有人离开该块时,网络中的该高度显示为空块。因为也有可能多人同时阻塞,所以Filecoin团队将tipset——tipset设计为阻塞的集合。和BTC网络一样,由于网络延迟,可能会同时存在两个提示集,但最终网络会根据权重选择唯一的提示集,向下发展链式机制。每个块的重量计算公式如下:

重量=父母重量ECV ECPrM *比率

目前ECV设为10,ECPrM设为100,比值就是当前节点的存储效率(本节点的存储容量/所有节点的存储容量)。也就是说,在目前的算法下,节点的比例越高,权重越高。重量相同时,票值小的tipset会当选。因为这种技术设计也使得filecoin的底层架构更倾向于DAG结构。

复制证明一致性算法用于证明挖掘者确实完成了指定的工作。在Filecoin网络中,矿工的主要工作是存储用户的数据。矿工需要把用户的数据封在一个扇区里。在封口过程中,系统会生成一个DRG (Depth-Robust-Graph),也称为复制值。只有对应于副本值的存储空间可以被认为是有效的存储空间。

空间证明一致性是验证的最后一步。每生成一个新块,网络都会随机挑战挖掘者,挖掘者需要提供副本值进行验证,通过零知识证明进行验证。如果结果正确,则意味着矿工正常存储封装的数据,并且他们的有效存储份额保持不变。如果存在无法正确验证的副本值,则将从有效存储空间中移除与该副本值对应的存储空间。

Filecoin有哪些值得关注的问题?

目前Filecoin的技术方案与传统成熟的云存储方案还有较大差距。这里就简单分析一下Filecoin目前存在的问题。

与传统的集中式存储相比,分散式存储最大的优势在于可以更好地保护数据安全的隐私性。但Filecoin目前的设计让人质疑数据的安全性和隐私性。

我们来看一下用户存储的流程:订单匹配成功后,用户会直接将原始数据发送给矿工,然后用户的数据没有加密和分段。矿工可以直接访问完整的用户数据,而不会被网络或用户发现。按照这种技术方案,Filecoin中用户个人数据的隐私将受到极大威胁,其安全性和隐私性甚至弱于传统的云存储方案。同时,在存储过程的前期,存在导致数据直接泄露的漏洞,那么后续过程中保证数据隐私的加密、分段等方法就变得毫无意义。

另一方面,由于用户的所有数据都存储在矿工的硬盘中,如果矿工因为某种原因放弃挖掘,这里的用户的数据将从网络中完全丢失,在矿工将其推出之前,网络中没有相关的机制让用户取回他的数据。诸如此类的不可预测事件也大大降低了Filecoin网络中数据的安全性和可靠性。

同时,根据之前该项目AMA提到的信息,Filecoin只是一个协调存储提供商和用户需求的协议,并不能要求存储提供商做指定的操作。虽然这降低了去中心化的风险和平台操纵用户数据的发生,但也降低了存储提供商的邪恶成本。即使存储应用方要求存储提供方删除或销毁其存储的数据,存储提供方也可以欺骗用户私自复制用户数据,甚至强迫其不执行用户要求。目前传统云存储的技术设备或服务提供商都是大公司,出现问题后可以立即确定责任方,开始解决问题。而Filecoin等去中心化网络中的矿工相对分散且不为人知,这也给问题发生后的后续解决造成了很大的障碍,使得其综合安全性弱于集中存储。

用户体验问题

根据白皮书描述的整体情况,Filecoin用户的体验应该是差的。首先,除了最简单的存储功能,Filecoin项目并没有向用户提供任何额外的技术服务,比如灾难恢复解决方案。用户只能通过将自己的文件存储在几个不同的节点中,来应对由于存储单元的断开和损坏而导致的数据无法访问甚至丢失的问题。对于不懂技术和容灾的用户来说,可能会导致用户数据永久丢失。

另外,因为上面提到的信息安全问题,如果用户想要进一步保证自己数据的安全,需要在存储文件之前对文件进行加密。这样对用户的操作要求更高,用户体验更差。

不完全存储技术方案

目前Filecoin的技术方案并不完备,这是影响用户使用其存储网络的重要原因,比如前面提到的容灾问题。按照Filecoin目前的设计方案,用户每次存储的数据都会由一个矿工独立存储,其他矿工不会主动存储这个文件的备份。容灾技术的要求大于传统云存储,因为传统云存储主要是设备本身的技术原因。然而,Filecoin在防止设备本身技术故障的同时,还需要防止存储矿工因各种主要原因而停止提供服务。造成这种情况的因素会远远多于造成简单技术故障的因素,解决方法也会复杂很多。

目前Filecoin解决容灾问题的方法是让用户将自己的数据存储在多个矿工中进行主动备份。但是在网络初期,由于矿工自身的不稳定性,不排除会出现多个备份数据丢失,甚至全部备份丢失的情况,这对用户和网络的运行都会是很大的打击。

同时,由于纯主动备份,存储网络的冗余问题无法解决。在传统存储中,由于存储是集中式的,系统可以在后台对所有数据进行分析、处理和优化,去除重复数据,提高存储网络的效率。虽然去中心化的特性无法处理用户存储的非公开数据,但如何结合IPFS网络的特点,针对用户存储的公开数据优化数据存储结构,是团队需要认真研究的一个方向。

上面提到的三个问题在不同程度上制约了Filecoin未来的发展。从文章开头对传统存储市场的分析可以看出,目前的存储市场基本分为两类:第一类主要服务于个人和小型企业用户,主要以SaaS平台的技术形态存在。经过多年的发展,SaaS平台的用户体验和产品多样性已经相对成熟。同时,其在Baidu.com、Google Drive等云盘上的应用,在文件传输、文件搜索或协同办公方面都有自己的特色和优势。Filecoin本身在竞争中没有优势。如果数据安全还存在漏洞,那么filecoin将无法在这场竞争中生存。

即使解决了数据安全问题,从真实的存储需求来看,Filecoin目前的发展也不容易乐观。根据文章开头提供的中国网盘用户存储数据,目前云盘TGI用户前三主要是电影、体育、动漫。这些类型的相关视频或图片资料更注重交流而非隐私。与分散存储相比,用户可以共享或查询的传统网盘会更占优势。

真正需要分散存储的数据大致可以分为两类:一是个人照片、私人文件等数据。对分散存储有更大的需求,但这样的数据在目前的股票市场上相对较少。第二,未来个人物联网配置产生的个人数据。但由于现在小米等头部物联网设备公司将用户数据视为重要资产,并能通过其产生巨大价值,所以在没有具体规定的情况下,头部公司不会将用户的数据返还给客人。如果头部企业不愿意归还个人数量,不适合分散存储,那么即使个人用户愿意使用也没有意义,因为他们的根本目的没有达到。

第二类用户是大中型企业。大中型企业主要使用云存储来存储公司相关数据,因此对存储方案的可靠性、安全性和私密性有较高的要求。目前,传统的解决方案包括公有云、私有云、混合云和传统存储矩阵。私有云与传统存储硬件的结合,解决了公司客户对公有云数据隐私的担忧,也可以满足客户对存储解决方案可靠性和安全性的需求。目前Filecoin在三个方面落后于传统云存储方案,无法与之竞争。与传统存储矩阵相比,分散存储带来的好处并不是传统存储矩阵用户所追求的,因此很难在这些用户中进行转化。对于去中心化存储,未来既能保证数据的可靠性、安全性和私密性,又能使价格低于目前的传统云存储方案,这样就可以开始发展ToB相关的业务。

除了技术因素,Filecoin项目还有很多不确定性。

首先是团队因素。2018年,主网两次上线承诺均未兑现。挖掘从CPU挖掘更改为GPU挖掘。同时,在测试网络阶段改变了挖掘规则。虽然后来的改变是为了防止矿工恶意刷垃圾数据,但这样频繁的改变降低了用户和网络参与者的信任度。

此外,到目前为止,Filecoin的挖掘奖励机制和分配规则尚未确定,这进一步增加了项目的不确定性。

最后,Filecoin的挖掘逻辑不同于其他POW类型。该项目需要矿工的长期参与,不能中途退出,因为矿工的退出可能会导致数据永久丢失。但Filecoin挖掘的具体细节过于复杂,收入情况难以预算,也增加了不可控因素。能否有足够多的矿工参与进来并顺利留下来,是一个值得关注的问题。同时矿工中途离开会对网络产生很多影响,只能主上线后才能判断。

价格方面,由于Filecoin存在上面提到的各种技术和产品问题,需要一个相对于传统云存储有吸引力的价格来降低用户的使用成本。

梳理主流云存储SaaS应用

通过以上分析,我们可以知道,目前Filecoin的主要竞争对手将是传统云存储系统中的Saas应用,因此以下将对目前市场上主流的toB和toC的SaaS服务收费方案进行梳理,以供读者参考:

Dropbox个人版免费提供2G存储空间,PLUS版提供2T存储空间以及文本搜索。手机离线存储等服务每月78元人民币,专业版提供3T存储空间。在Plus的基础上,还提供AutoOCR、文档协同编辑、文件锁定等服务,每月130元人民币。

ToB版,plus每月81元,5T存储空间,2G文件传输能力,3人起。专业版每人每月130元,提供无线数据空间和300G文件传输能力,也是3人使用。

箱子

个人版免费提供10G存储空间,单个上传文件大小限制在250M。费用分为5美元/月、15美元/月、25美元/月和35美元/月。US$ 5计划提供100G存储空间,上传单个文件大小限制为2gb;15美元的机会提供无线存储空间,单个上传文件的大小限制为5GB。同时,你可以将盒子与一个app连接,并将app数据直接存储到盒子中。25美元计划允许您连接三个应用程序,而35美元计划允许您连接无限个应用程序。

百度网盘

百度个人网盘的付费方案如上图所示。svip每月18元,普通会员每月8元。非会员在完成任务前拥有15G存储空间,完成一系列分享任务后将获得2T存储空间。

上图是百度企业网盘的介绍和价格。

与上面列举的三家集中式存储提供商相比,Filecoin在企业级服务上还是很难与他们竞争的。在个人服务方面,Filecoin只能通过定制更灵活的支付方案和更低的价格与之竞争。同时,Filecoin等分布式存储项目也需要丰富附加功能,提高竞争力。

分散存储的发展前景

相对于集中式云存储行业,技术架构和运营模式相对成熟。分散存储的概念是最近两年才提出来的,无论是技术设计还是运营模式都有很大的提升空间。分散存储的发展应充分利用成熟的云存储方案,并根据自身特点进行改进。

全盘否定之前所有集中存储的技术方案过于草率,试图用新的不完善的方案直接替代原有方案也难以得到市场的认可。只有在创新和传统之间找到良好的平衡,才能创造出符合市场需求的产品。

目前像IPFS一样重新建立底层网络协议是非常好的尝试,但是可用性比较差,很难满足存储用户的基本需求。

相对而言,利用区块链技术在当前公有云上搭建夹层可能是更好的选择,因为这种方案既能全面调度高性能存储资源,又能保证用户信息的私密性,同时还能充分享受传统云存储完整的存储技术体系。这种落地方案可以相对较快地满足去中心化的要求,保证数据的安全性和私密性,同时给去中心化存储技术足够的开发时间。它不仅让用户有时间和机会了解更多关于集中式存储的知识,也有利于未来分散化技术的大规模实施。但不可否认的是,只有通过不断的创新和尝试,去中心化的生态存储才能开辟出一条适合自己的道路。

广告位
本文来自网络,不代表区块链网站|NFTS立场,转载请注明出处:https://www.qklwz.com/jzb/fil/32759.html
上一篇
下一篇

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

返回顶部