云计算:
1、云计算->IT资源的拥有权和使用权的分离(资源归云计算中心所有,使用权归付费用户所有)
2、云平台的角色:聚合->平台->一种生态系统(如apple的app store、淘宝网等,平台演变成一种经济生态环境)
3、云计算和物联网类软件登记量带905和380件,同比增长200.66%和119.65,说明发展趋势很显著。但是(以北京地区为例)软件登记量和产品登记量分别为262、152以及7、16,软件转化为产品的转化率不足1%。为何?(转化期长,且回报周期也长,另外国人付费消费软件的意识不强)
4、据中国互联网协会预计,2012年我国云计算市场规模将超600亿元,“十二五”期间,产业链规模达7500亿元至1万亿元。
5、云存储应用的主要存储类型有:Nearline Storage、Disaster Recovery、Archive、Collaboration/File Sharing、Primary Storage、Backup(RD和backup只产生很少的固定时刻的费用。但如果将文件或数据访问业务托管到云存储平台,那么费用会成为一大考虑因素,不过倒也省了很多访问评价、空间容量不足的担心)
6、63%的云用户使用的是PaaS,用其来开发和部署基于云的应用。在使用PaaS云服务的用户中,43%使用其来开发和部署移动应用,30%依赖PaaS进行应用测试。(使用PaaS会极大的依赖云平台厂商,之后若想跨厂商基本不太可能,如果是想跨厂商,那还是使用IssA比较好)
大数据 AND 云计算
7、大数据&云时代->对商业模式造成的冲击?(从前在内部维护IT团队的企业是否考虑将硬件部分托管给云平台厂商?自己更专注于web服务的开发或业务的创新?在考虑IT成本时,是否可以将运维成本省去而增补研发成本?对大数据而已,因为MapReduce需要使用java语言编写,而分析数据有需要数学统计学背景,企业如何招聘这样的人才?是否会产生类似“结对编程”的“结对工作”模式?)
8、大数据VS云计算:
大数据通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析通常与云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百甚至数千的电脑分配工作。
9、小企业应该开启其大数据策略。数据可以帮助每个人,当不再丢弃数据,即成为大数据。(那么大数据的存储是否需要动用云平台帮忙?如果数据存储在云平台,分析是否也在云平台完成?那么启用大数据策略所带来的成本与收益之间如何平衡?)
10、大数据是否会成为BI(Business Intelligence)的继任者?(BI在对resource数据进行extract时会丢弃一部分数据,更不用说企业数据在录入resource时被遗弃的那些数据了,就信息量来说,BI的基础信息储备就远远小于大数据。大数据还是颇为值得期待的)
小结:
云计算被说得玄乎其玄,但是对一般的用户而言,云计算其实就是提供了一种按需付费的计算或存储资源。也就是上面1中说的“IT资源的拥有权和使用权的分离”,有点像现在的公司租用商业写字楼的感觉。
而大数据,如果按照8、9中的描述,它将收集企业几乎所有的信息用于分析,无疑是在digging一座矿藏。digging的方法以及所期望得到的目标都很让人期待。之前在学BI时,就觉得BI很诱人,但前戏实在太漫长。要抽取(extract)、转换(transform)然后还要装载(load)到数据库中(即传说中的ETL),然后进行分析。在这个过程中,形式化和清洗数据就让人很纠结。更别提如果还要将非结构化数据进行结构化了。
大数据就不存在这个问题,它分析的基础就是非结构化或半机构化的数据。虽然存取、分析的速度也许比不上数据库的SQL语言,但一想到保留了资源的多样性和原生态性就很高兴。终于不用在分析之前剔除我们以为是冗余或无用但有可能带给我们惊喜的数据了!但是完备的数据保留和非结构化的数据形式所需求的额外的存储以及计算资源是否适合于请求云平台帮忙?哪类型的公司又适用于启用云平台来完成大数据时代的转型?也许用户面越广泛,即类型越通用的软件的厂商更适合大数据。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:云计算VS大数据 记与思 - Python技术站