集群,什么是集群？

时间：2023-06-26 17:21:00 出处：日记网编辑：日记君

1，什么是集群？
2，什么是集群？集群是什么意思？
3，什么是Linux集群
4，分布式与集群的区别是什么？
5，如何理解分布式与集群，二者区别是什么
6，分布式与集群的区别是什么？
7，服务器分布式和集群的区别
8，什么是集群服务器？
9，什么是服务器集群？
10，云计算,云存储中的"云"是什么意思?

1，什么是集群？

集群主要分成三大类（高可用集群，负载均衡集群，科学计算集群）
高可用集群( High Availability Cluster)
负载均衡集群(Load Balance Cluster)
科学计算集群(High Performance Computing Cluster)

1、高可用集群(High Availability Cluster)
常见的就是2个节点做成的HA集群，有很多通俗的不科学的名称，比如”双机热备”, “双机互备”, “双机”。高可用集群解决的是保障用户的应用程序持续对外提供服务的能力。 (请注意高可用集群既不是用来保护业务数据的，保护的是用户的业务程序对外不间断提供服务，把因软件/硬件/人为造成的故障对业务的影响降低到最小程度)。

2、负载均衡集群(Load Balance Cluster)

负载均衡系统：集群中所有的节点都处于活动状态，它们分摊系统的工作负载。一般Web服务器集群、数据库集群和应用服务器集群都属于这种类型。

负载均衡集群一般用于相应网络请求的网页服务器，数据库服务器。这种集群可以在接到请求时，检查接受请求较少，不繁忙的服务器，并把请求转到这些服务器上。从检查其他服务器状态这一点上看，负载均衡和容错集群很接近，不同之处是数量上更多。

3、科学计算集群(High Performance Computing Cluster)

高性能计算(High Perfermance Computing)集群，简称HPC集群。这类集群致力于提供单个计算机所不能提供的强大的计算能力。

高性能计算分类：　

3.1、高吞吐计算(High-throughput Computing)
有一类高性能计算，可以把它分成若干可以并行的子任务，而且各个子任务彼此间没有什么关联。象在家搜寻外星人（ SETI@HOME – Search for Extraterrestrial Intelligence at Home ）就是这一类型应用。
这一项目是利用Internet上的闲置的计算资源来搜寻外星人。SETI项目的服务器将一组数据和数据模式发给Internet上参加SETI的计算节点，计算节点在给定的数据上用给定的模式进行搜索，然后将搜索的结果发给服务器。服务器负责将从各个计算节点返回的数据汇集成完整的数据。因为这种类型应用的一个共同特征是在海量数据上搜索某些模式，所以把这类计算称为高吞吐计算。
所谓的Internet计算都属于这一类。按照 Flynn的分类，高吞吐计算属于SIMD（Single Instruction/Multiple Data）的范畴。

3.2、分布计算(Distributed Computing)
另一类计算刚好和高吞吐计算相反，它们虽然可以给分成若干并行的子任务，但是子任务间联系很紧密，需要大量的数据交换。按照Flynn的分类，分布式的高性能计算属于MIMD（Multiple Instruction/Multiple Data）的范畴。

下面说说这几种集群的应用场景：

高可用集群这里不多作说明。

想Dubbo是比较偏向于负载均衡集群，用过的猿友应该知道（不知道的可以自行了解一下），Dubbo同一个服务是可以有多个提供者的，当一个消费者过来，它要消费那个提供者，这里是有负载均衡机制在里面的。

搜索引擎Elasticsearch比较偏向于科学计算集群的分布计算。

而到这里，可能不少猿友都知道，集群的一些术语：集群容错、负载均衡。

我们以Dubbo为例：
集群容错（http://dubbo.io/User+Guide-zh.htm#UserGuide-zh-%E9%9B%86%E7%BE%A4%E5%AE%B9%E9%94%99）

Dubbo提供了这些容错策略：
集群容错模式：
可以自行扩展集群容错策略，参见：集群扩展
Failover Cluster
失败自动切换，当出现失败，重试其它服务器。(缺省)
通常用于读操作，但重试会带来更长延迟。
可通过retries="2"来设置重试次数(不含第一次)。

Failfast Cluster
快速失败，只发起一次调用，失败立即报错。
通常用于非幂等性的写操作，比如新增记录。

Failsafe Cluster
失败安全，出现异常时，直接忽略。
通常用于写入审计日志等操作。

Failback Cluster
失败自动恢复，后台记录失败请求，定时重发。
通常用于消息通知操作。

Forking Cluster
并行调用多个服务器，只要一个成功即返回。
通常用于实时性要求较高的读操作，但需要浪费更多服务资源。

可通过forks="2"来设置最大并行数。

Broadcast Cluster
广播调用所有提供者，逐个调用，任意一台报错则报错。(2.1.0开始支持)
通常用于通知所有提供者更新缓存或日志等本地资源信息。

负载均衡（http://dubbo.io/User+Guide-zh.htm#UserGuide-zh-%E8%B4%9F%E8%BD%BD%E5%9D%87%E8%A1%A1）

Dubbo提供了这些负载均衡策略：

Random LoadBalance

随机，按权重设置随机概率。

在一个截面上碰撞的概率高，但调用量越大分布越均匀，而且按概率使用权重后也比较均匀，有利于动态调整提供者权重。

RoundRobin LoadBalance
轮循，按公约后的权重设置轮循比率。
存在慢的提供者累积请求问题，比如：第二台机器很慢，但没挂，当请求调到第二台时就卡在那，久而久之，所有请求都卡在调到第二台上。

LeastActive LoadBalance
最少活跃调用数，相同活跃数的随机，活跃数指调用前后计数差。
使慢的提供者收到更少请求，因为越慢的提供者的调用前后计数差会越大。

ConsistentHash LoadBalance
一致性Hash，相同参数的请求总是发到同一提供者。
当某一台提供者挂时，原本发往该提供者的请求，基于虚拟节点，平摊到其它提供者，不会引起剧烈变动。
算法参见：http://en.wikipedia.org/wiki/Consistent_hashing。

缺省只对第一个参数Hash，如果要修改，请配置

缺省用160份虚拟节点，如果要修改，请配置

2，什么是集群？集群是什么意思？

简单的说，集群（cluster）就是一组计算机，它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点（node）。一个理想的集群是，用户从来不会意识到集群系统底层的节点，在他们看来，集群是一个系统，而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。

（1）为同一种或若干种生物在某种程度上恒定地占据某一地区的，广泛的且具有社会性微细差异的用词。因而该词有各种不同的意义。在生态学上，有时用以表示群，或群落或种群；有时则用以表示单位集团之意。植物是指全面，而动物则明显地是指哺乳类、鸟类以及蚁、蜂等社会性昆虫。集群内个体的社会结合程度也各有不同，可以区分为永久性集群（permanent colony）、季节性集群（seasonalcolony）以及繁殖集群（breeding colony）等。进而可把由同一种形成的集群称为种内集群（intraspe－cific colony）；把由二种以上形成的集群称为种间集群（interspecific colony）。但也有时集群一词没有上述意义，而是指最先迁入到新地上来的群体，或指社会昆虫在同一巢穴中生活的一个集团。
　　
（2）特指上述之中的群体。
　　
（3）对细菌和霉菌的培养细胞特称为菌落。

3，什么是Linux集群

集群通信系统是一种计算机系统，
它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。简单地说，集群(cluster)就是一组计算机，它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点(node)。一个理想的集群，用户是不会意识到集群系统底层的节点的。在他们看来，集群是一个系统，而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。
集群已不是一个全新的概念，早在七十年代计算机厂商和研究机构就对集群系统进行了研究和开发。这些系统不为大家熟知，是因为它主要用于科学工程计算。直到Linux集群的出现，集群的概念才得以广泛传播。集群系统主要分为高可用(High
Availability)集群，简称HA集群，和高性能计算(High Perfermance Computing)集群，简称HPC集群。
在Linux出现前，集群系统采用的操作系统主要有VMS、UNIX和WindowsNT。到九十年代末期，linux操作系统不断走向成熟，它的健壮性不断增强，并且提供了GNU软件和标准化的PVM、MPI消息传递机制，最重要的是Linux在普通PC机上提供了对高性能网络的支持，这样就大大推动了基于Linux的集群系统的普及和发展。

4，分布式与集群的区别是什么？

简单说，分布式是以缩短单个任务的执行时间来提升效率的，而集群则是通过提高单位时间内执行的任务数来提升效率。
　　例如：
　　如果一个任务由10个子任务组成，每个子任务单独执行需1小时，则在一台服务器上执行改任务需10小时。
　　采用分布式方案，提供10台服务器，每台服务器只负责处理一个子任务，不考虑子任务间的依赖关系，执行完这个任务只需一个小时。(这种工作模式的一个典型代表就是Hadoop的Map/Reduce分布式计算模型）
　　而采用集群方案，同样提供10台服务器，每台服务器都能独立处理这个任务。假设有10个任务同时到达，10个服务器将同时工作，10小后，10个任务同时完成，这样，整身来看，还是1小时内完成一个任务！
　　以下是摘抄自网络文章：
　　一、集群概念
　　1. 两大关键特性
　　集群是一组协同工作的服务实体，用以提供比单一服务实体更具扩展性与可用性的服务平台。在客户端看来，一个集群就象是一个服务实体，但事实上集群由一组服务实体组成。与单一服务实体相比较，集群提供了以下两个关键特性：
　　· 可扩展性－－集群的性能不限于单一的服务实体，新的服务实体可以动态地加入到集群，从而增强集群的性能。
　　· 高可用性－－集群通过服务实体冗余使客户端免于轻易遇到out of service的警告。在集群中，同样的服务可以由多个服务实体提供。如果一个服务实体失败了，另一个服务实体会接管失败的服务实体。集群提供的从一个出错的服务实体恢复到另一个服务实体的功能增强了应用的可用性。
　　2. 两大能力
　　为了具有可扩展性和高可用性特点，集群的必须具备以下两大能力：
　　· 负载均衡－－负载均衡能把任务比较均衡地分布到集群环境下的计算和网络资源。
　　· 错误恢复－－由于某种原因，执行某个任务的资源出现故障，另一服务实体中执行同一任务的资源接着完成任务。这种由于一个实体中的资源不能工作，另一个实体中的资源透明的继续完成任务的过程叫错误恢复。
　　负载均衡和错误恢复都要求各服务实体中有执行同一任务的资源存在，而且对于同一任务的各个资源来说，执行任务所需的信息视图（信息上下文）必须是一样的。
　　3. 两大技术
　　实现集群务必要有以下两大技术：
　　· 集群地址－－集群由多个服务实体组成，集群客户端通过访问集群的集群地址获取集群内部各服务实体的功能。具有单一集群地址（也叫单一影像）是集群的一个基本特征。维护集群地址的设置被称为负载均衡器。负载均衡器内部负责管理各个服务实体的加入和退出，外部负责集群地址向内部服务实体地址的转换。有的负载均衡器实现真正的负载均衡算法，有的只支持任务的转换。只实现任务转换的负载均衡器适用于支持ACTIVE-STANDBY的集群环境，在那里，集群中只有一个服务实体工作，当正在工作的服务实体发生故障时，负载均衡器把后来的任务转向另外一个服务实体。
　　· 内部通信－－为了能协同工作、实现负载均衡和错误恢复，集群各实体间必须时常通信，比如负载均衡器对服务实体心跳测试信息、服务实体间任务执行上下文信息的通信。
　　具有同一个集群地址使得客户端能访问集群提供的计算服务，一个集群地址下隐藏了各个服务实体的内部地址，使得客户要求的计算服务能在各个服务实体之间分布。内部通信是集群能正常运转的基础，它使得集群具有均衡负载和错误恢复的能力。
　　二、集群分类
　　Linux集群主要分成三大类(高可用集群，负载均衡集群，科学计算集群)
高可用集群(High Availability Cluster)
负载均衡集群(Load Balance Cluster)
科学计算集群(High Performance Computing Cluster)
　　具体包括：
　　Linux High Availability 高可用集群
　　(普通两节点双机热备，多节点HA集群，RAC, shared, share-nothing集群等)
　　Linux Load Balance 负载均衡集群
　　 (LVS等....)
　　Linux High Performance Computing 高性能科学计算集群
　　 (Beowulf 类集群....)
　　三、详细介绍
　　1. 高可用集群(High Availability Cluster)
　　常见的就是2个节点做成的HA集群，有很多通俗的不科学的名称，比如"双机热备"，"双机互备"，"双机"。
　　高可用集群解决的是保障用户的应用程序持续对外提供服务的能力。 (请注意高可用集群既不是用来保护业务数据的，保护的是用户的业务程序对外不间断提供服务，把因软件/硬件/人为造成的故障对业务的影响降低到最小程度)。
　　2. 负载均衡集群(Load Balance Cluster)
　　负载均衡系统：集群中所有的节点都处于活动状态，它们分摊系统的工作负载。一般Web服务器集群、数据库集群和应用服务器集群都属于这种类型。
　　负载均衡集群一般用于相应网络请求的网页服务器，数据库服务器。这种集群可以在接到请求时，检查接受请求较少，不繁忙的服务器，并把请求转到这些服务器上。从检查其他服务器状态这一点上看，负载均衡和容错集群很接近，不同之处是数量上更多。
　　3. 科学计算集群(High Performance Computing Cluster)
　　高性能计算(High Perfermance Computing)集群，简称HPC集群。这类集群致力于提供单个计算机所不能提供的强大的计算能力。
　　3.1 高性能计算分类　　　
　　3.1.1 高吞吐计算(High-throughput Computing)
　　有一类高性能计算，可以把它分成若干可以并行的子任务，而且各个子任务彼此间没有什么关联。象在家搜寻外星人（ SETI@HOME -- Search for Extraterrestrial Intelligence at Home ）就是这一类型应用。这一项目是利用Internet上的闲置的计算资源来搜寻外星人。SETI项目的服务器将一组数据和数据模式发给Internet上参加SETI的计算节点，计算节点在给定的数据上用给定的模式进行搜索，然后将搜索的结果发给服务器。服务器负责将从各个计算节点返回的数据汇集成完整的数据。因为这种类型应用的一个共同特征是在海量数据上搜索某些模式，所以把这类计算称为高吞吐计算。所谓的Internet计算都属于这一类。按照 Flynn的分类，高吞吐计算属于SIMD（Single Instruction/Multiple Data）的范畴。
　　3.1.2 分布计算(Distributed Computing)
　　另一类计算刚好和高吞吐计算相反，它们虽然可以给分成若干并行的子任务，但是子任务间联系很紧密，需要大量的数据交换。按照Flynn的分类，分布式的高性能计算属于MIMD（Multiple Instruction/Multiple Data）的范畴。
　　四、分布式（集群）与集群的联系与区别
　　分布式是指将不同的业务分布在不同的地方；而集群指的是将几台服务器集中在一起，实现同一业务。
　　分布式中的每一个节点，都可以做集群。而集群并不一定就是分布式的。
　　举例：就比如新浪网，访问的人多了，他可以做一个群集，前面放一个响应服务器，后面几台服务器完成同一业务，如果有业务访问的时候，响应服务器看哪台服务器的负载不是很重，就将给哪一台去完成。
　　而分布式，从窄意上理解，也跟集群差不多，但是它的组织比较松散，不像集群，有一个组织性，一台服务器垮了，其它的服务器可以顶上来。
　　分布式的每一个节点，都完成不同的业务，一个节点垮了，那这个业务就不可访问了。

5，如何理解分布式与集群，二者区别是什么

分布式是指不同的业务分布在不同的地方，集群指的是将几台服务器集中在一起，实现同一业务。白话理解的话，比如公司项目上线初期（举例电子商务网站）
初期：用户访问量低，只弄了一台服务器，一个tomcat项目运行一个web工程。
中期：用户访问量提高，服务器崩了，为了解决这个问题，购买服务器，增加服务器数量，然后每个服务器中个各放了一份，使用nginx代理转发。（这就是运用集群原理）
后期：用户访问量不断增加，响应速度变慢，服务器又崩了，在不考虑增加服务器带宽、内存和CPU的情况下如何解决这个问题？先解决响应速度变慢，用户频繁调用数据库，在客户端与数据库之间，使用redis缓存。解决之后，又发现问题：由于每台服务器运行一个tomcat，放着一个web工程，用户有可能在商品详情存在大幅度调用数据库，而订单列表调用幅度小，此时就存在着模块之间耦合度高，一个功能升级其他也需要升级，扩展性差，不能灵活部署。是该考虑项目重构，把项目按照模块分为不同的系统（使用zookeeper进行模块之间通信），例如：订单系统，会员系统、搜索系统、商品信息系统。把每个模块进行拆分，用户在哪个系统访问频繁，就针对哪个系统进行对症下药，增加缓存还是使用其他技术。（这样我们就可以单独对这个模块进行服务性能的提升，不用全部都一起提升。也降低了代码的耦合度，模块之间互不影响，即使后期增加开发人员，也可按照敏捷开发思想只对其负责模块进行开发，效率大大提升）。这样一个web工程就拆分成多个web工程（多个tomcat部署）。那这个项目就可以在一台服务器部署多个工程（不同端口进行通信）或者多台服务器运行单个项目。（这就是分布式原理）
总而言之，分布式是以缩短单个任务的执行时间来提升效率的，而集群则是通过提高单位时间内执行的任务数来提升效率。

6，分布式与集群的区别是什么？

集群强调高可用，分布式强调多业务协作物理与逻辑集群倾向于物理概念，即多台机器组成一个集群。这多台机器是否有合作关系并不能保证，比如我们会说我们公司的一个规模为1000台机器的物理集群部署在昌平，但是这1000台机器可能是给公司内不同的平台提供服务，但是从物理角度，由于都部署在一起，在同一个机房，就可以称之为集群。分布式倾向于逻辑概念，即多个节点或程序为了一个共同的目标，部署在一个或者多个物理机器上。举个例子，一台物理机上装了一个Nginx，它连接的两个Tomcat也在这台物理机上，但是这个Nginx代表的服务，就可以称之为分布式。当然，为了安全性，稳定性等原因，我们并不建议把分布式部署在一个物理节点上。图片发自简书App 冗余与分解集群除了可以用来表示多个物理机器，还可以表示一种“冗余”的理念，即通过部署多个同样功能的节点，来实现扩展性与可用性的提升。举个例子，通过在不同节点上部署两个同样功能的server，来这样就算其中一个节点宕机，也能保证服务的可用性。而扩展性，比如一个server的qps可用承担到2000，但是随着用户群体的增加，qps需要达到3000，那么我们就可以通过增加一个Tomcat节点的方式来实现扩容。分布式的分解与微服务的概念有点相近，即把一个系统的功能分布在不同节点上，每个节点都承担了不同的责任，这样分模块部署最主要的优势是业务隔离，即个别功能的问题或者改进不会影响其他模块，这样就算个别模块挂掉，其他模块也能够继续运作。举个例子，前些年春晚抢红包的时候，曾经由于瞬时间请求量太大导致把微信和支付宝给弄瘫痪了，但是大家都知道，瘫痪的只是红包部分的功能，微信的信息功能并不受影响，这就是分布式的好处。

7，服务器分布式和集群的区别

服务器集群：
服务器集群就是指将很多服务器集中起来一起进行同一种服务，在客户端看来就像是只有一个服务器。集群可以利用多个计算机进行并行计算从而获得很高的计算速度，也可以用多个计算机做备份，从而使得任何一个机器坏了整个系统还是能正常运行。
服务器负载均衡：
负载均衡（Load Balancing）建立在现有网络结构之上，它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。
分布式服务器：
所谓分布式资源共享服务器就是指数据和程序可以不位于一个服务器上，而是分散到多个服务器，以网络上分散分布的地理信息数据及受其影响的数据库操作为研究对象的一种理论计算模型服务器形式。分布式有利于任务在整个计算机系统上进行分配与优化，克服了传统集中式系统会导致中心主机资源紧张与响应瓶颈的缺陷，解决了网络GIS 中存在的数据异构、数据共享、运算复杂等问题，是地理信息系统技术的一大进步。
这个三种架构都是常见的服务器架构，集群的主要是IT公司在做，可以保障重要数据安全；负载均衡主要是为了分担访问量，避免临时的网络堵塞，主要用于电子商务类型的网站；分布式服务器主要是解决跨区域，多个单个节点达到高速访问的目前，一般是类似CDN的用途的话，会采用分布式服务器。

8，什么是集群服务器？

集群是由一些互相连接在一起的计算机构成的一个并行或分布式系统。这些计算机一起工作并运行一系列共同的应用程序，同时，为用户和应用程序提供单一的系统映射。从外部来看，它们仅仅是一个系统，对外提供统一的服务。集群内的计算机物理上通过电缆连接，程序上则通过集群软件连接。这些连接允许计算机使用故障应急与负载平衡功能，而故障应急与负载平衡功能在单机上是不可能实现的。
服务器集群系统通俗地讲就是把多台服务器通过快速通信链路连接起来，从外部看来，这些服务器就像一台服务器在工作，而对内来说，外面来的负载通过一定的机制动态地分配到这些节点机中去，从而达到超级服务器才有的高性能、高可用。

9，什么是服务器集群？

分布式与集群是不一样的，简单说，分布式是以缩短单个任务的执行时间来提升效率的，而集群则是通过提高单位时间内执行的任务数来提升效率。如果一个任务由10个子任务组成，每个子任务单独执行需1小时，则在一台服务器上执行改任务需10小时。采用分布式方案，提供10台服务器，每台服务器只负责处理一个子任务，不考虑子任务间的依赖关系，执行完这个任务只需一个小时。而采用集群方案，同样提供10台服务器，每台服务器都能独立处理这个任务。假设有10个任务同时到达，10个服务器将同时工作，10小后，10个任务同时完成，这样，整体来看，还是1小时内完成一个任务。扩展资料分布式系统可以分为机体内系统、建筑物内系统、建筑物间系统和不同地理范围的区域系统等，它们的耦合度依次由高到低按应用领域的性质决定耦合度，可以分成三类：一、是面向计算任务的分布并行计算机系统和分布式多用户计算机系统，它们要求尽可能高的耦合度，以便发展成为能分担大型计算机和分时计算机系统所完成的工作。二、是面向管理信息的分布式数据处理系统。耦合度可以适当降低。三、是面向过程控制的分布式计算机控制系统。耦合度要求适中，当然对于某些实时应用，其耦合度的要求可能很高。

10，云计算,云存储中的"云"是什么意思?

来自alps88112919 的回答
其实这个cloud可以理解为一块，一个集合（group），但这是一个动态的group，一个隶属于因特网的计算群体，里面可以有超级计算机，也可以有普通计算机——这不重要，重要的是这个计算集群可以为你提供一定的计算服务（这会比你自己计算更划算）。
换句话说，就是我有一台pc，然后我接上网络，我需要进行大型计算，我就可以把数据发送给这个计算集群（事实上云成熟之后，你不必知道是什么计算集群再帮你计算，你要的只是计算结果）。这就是云计算。
然后所谓的云，你想一下，一旦云计算实现，计算也会相对的集中起来。最适于计算的机器将更多的进行他所善于的计算，为了加快计算，这些机器中较近的机器会紧密的联系在一起。
如果我们为云时代的互联网画一张大图，计算密度越高的地方颜色越深，那么就会出现一块一块的深色区域，在他的外围，颜色则较浅。看起来就是云了。（其实还是一块一块的，虽然我认为“云”这个翻译很好，但我也认为他很迷惑人。。。。。）
最后，总结：云，就是互联网上的提供计算服务的计算集群。
（ps 现在所谓的云计算，多是炒作。。。云计算的成功会对物联网产生巨大的影响。想象一下，如果你拿一个MP3，但是这个屁点的小玩意能提供给你相当于笔记本的计算能力，有多恐怖。。。。电脑厂商全倒闭去吧。。只剩下手机和ipad之类的东西）
alps 回答