201808-23 大数据之Hadoop vs. Spark,如何取舍? NEW Hadoop在大数据领域享有多年垄断权,随着该领域开始出现新生力量,其统治地位正在逐渐下滑。年初的调查中,Hadoop被列为2018年大数据领域的“渐冻”趋势之一,Gartner的调查也揭示了Hadoop使用量的下滑,不少人将Hadoop称作“倒下的大象”,比如Lucidworks首席执行官Will Hayes。如果Hadoop开始进入寒冬期,率先崛起的会是呼声最高的Spark吗?笔者曾经看过一个非常有趣的比喻,Hadoop是第一家大型包工队,可以组织一大堆人合作(HDFS)... Read More >
201808-23 Hadoop与Spark之间的比较 NEW Hadoop框架的主要模块包括如下:Hadoop CommonHadoop分布式文件系统(HDFS)Hadoop YARNHadoop MapReduce虽然上述四个模块构成了Hadoop的核心,不过还有其他几个模块。这些模块包括:Ambari、Avro、Cassandra、Hive、 Pig、Oozie、Flume和Sqoop,它们进一步增强和扩展了Hadoop的功能。 Spark确实速度很快(最多比Hadoop MapReduce快100倍)。Spark还可以执... Read More >
201808-23 hadoop应用场景总结 NEW 我个人接触hadoop仅仅不到一年,因为是业余时间学习,故进度较慢,看过好多视频,买过好多书,学过基本知识,搭建过伪分布式集群,有过简单的教程式开发,恰逢毕业季,面试过相关岗位,自认为路还很远,还需一步一步积累。今天总结一篇关于hadoop应用场景的文章,自认为这是学习hadoop的第一步,本文主要解答这几个问题:hadoop的十大应用场景?hadoop到底能做什么?2012年美国著名科技博客GigaOM的专栏作家Derrick Harris跟踪云计算和Hadoop技术已有多... Read More >
201808-20 CMS内容管理系统开发-需求分析 第一天:关于CMS内容管理系统-需求分析说明书 首先来介绍一下什么是CMS内容管理系统(Content Management System)。网站内容管理系统具有许多基于模板的优秀设计,可以加快网站开发的速度和减少开发的成本。 网站内容管理系统的功能并不只限于文本处理,它也可以处理图片、Flash动画、声像流、图像甚至电子邮件档案。 网站内容管理系统其实是一个很广泛的称呼,从一般的博客程序,新... Read More >
201808-20 java系统高并发解决方案 一个小型的网站,比如个人网站,可以使用最简单的html静态页面就实现了,配合一些图片达到美化效果,所有的页面均存放在一个目录下,这样的网站对系统架构、性能的要求都很简单,随着互联网业务的不断丰富,网站相关的技术经过这些年的发展,已经细分到很细的方方面面,尤其对于大型网站来说,所采用的技术更是涉及面非常广,从硬件到软件、编程语言、数据库、WebServer、防火墙等各个领域都有了很高的要求,已经不是原来简单的html静态网站所能比拟的。大型网站,比如门户网站。在面对... Read More >
201808-20 千万级规模高性能、高并发的网络架构经验分享 https://blog.csdn.net/pingdouble/article/details/53895706主 题 :INTO100沙龙时间 :2015年11月21日下午地点 :梦想加联合办公空间分享人:卫向军(毕业于北京邮电大学,现任微博平台架构师,先后在微软、金山云、新浪微博从事技术研发工作,专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。)架构以及我理解中架构的本质在开始谈我对架构本质的理解之前,先谈谈... Read More >
201808-20 架构一个可承受千万级访问量的动态扩展CMS 目前CMS种类大致可分为两种,一种是通用CMS,还有一种是根据自身需求开发的私有CMS。 通用CMS比如dedecms、phpcms等CMS开源项目,适合技术实力不强的中小企业使用。 私有CMS,则结合自身需求,还定制开发的CMS,往往性能比通用型CMS要高。 开源通用型的CMS,虽然功能很强大,但是也有一些致命的缺点 1. 静态页面管理. 当文章数据达到 百万级别的时候,生成静态页面的速度不仅慢,而且加重磁盘IO负载。容易让硬... Read More >
201808-20 静态网站生成器将会成为下一个大热门 Matt Biilmann是现代静态网站托管服务Netlify的联合创始人兼CTO,在开发工具构建、内容管理系统和Web基础架构方面有10多年的经验。他从开源目录StaticGen及GitHub上发现,静态网站生成器发展迅速。像Nest和MailChimp这样专注于设计的公司现在就使用静态网站生成器构建他们的主要站点。Vox Media基于Middleman构建了一个完整的发布系统。Carrot使用自己的开源生成器Roots为一些世界上最知名的品牌创建网站。近日,... Read More >
201808-03 不灌鸡汤,年龄渐长,技术人的发展之路该怎么走? 文 / 左耳朵耗子技术圈中的很多人,最初都坚定地认为coding能改变世界。然而三五年过去后,还能不忘初心的人,少之又少。随着年龄的增长,梦想已被束之高阁,面包慢慢占据生活的大部分。对于个人发展,很多成功学者会给你灌各种鸡汤,但我们今天不这么做。2012年的时候写过一篇叫《程序算法与人生选择》的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有讲程序员可以发展的方向有哪些。 所以,就算是有这些所谓的方法论,我们可能对自己的发展还是会很纠结和无所事从,尤其是人到了... Read More >
201808-03 新时代严肃阅读指南:文本矩阵简述 文/vivo 1. 矩阵(matrix)是一个从线性代数里借用的概念,用来描述复杂的、可以从不同维度切分的文本系统,每一种拣选、组合原则即是一行,而被此原则选中的所有元素组成一列,组成矩阵的基本单位是一本本主题、风格、范围等一目了然的书籍,也可以是从所有文本里析取的其他抽象元素。 2. 之所以论述文本,只因为它是人类精神文化成果迄今为止发展最充分最完善的符号表达方式,也是任何知识人可以简便掌握且高效运用、进行再生产的工具(不是图像,它信息含量太低;不是... Read More >