一、Scala中的并发编程
1、Java中的并发编程
①Java中的并发编程基本上满足了事件之间相互独立,但是事件能够同时发生的场景的需要。
②Java中的并发编程是基于共享数据和加锁的一种机制,即会有一个共享的数据,然后有若干个线程去访问这个共享的数据(主要是对这个共享的数据进行修改),同时Java利用加锁的机制(即synchronized)来确保同一时间只有一个线程对我们的共享数据进行访问,进而保证共享数据的一致性。
③Java中的并发编程存在资源争夺和死锁等多种问题,因此程序越大问题越麻烦。
2、Scala中的并发编程
①Scala中的并发编程思想与Java中的并发编程思想完全不一样,Scala中的Actor是一种不共享数据,依赖于消息传递的一种并发编程模式, 避免了死锁、资源争夺等情况。在具体实现的过程中,Scala中的Actor会不断的循环自己的邮箱,并通过receive偏函数进行消息的模式匹配并进行相应的处理。
②如果Actor A和 Actor B要相互沟通的话,首先A要给B传递一个消息,B会有一个收件箱,然后B会不断的循环自己的收件箱, 若看见A发过来的消息,B就会解析A的消息并执行,处理完之后就有可能将处理的结果通过邮件的方式发送给A。
二、Scala中的Actor
1、什么是Actor
一个actor是一个容器,它包含 状态, 行为,信箱,子Actor 和 监管策略,所有这些包含在一个ActorReference(Actor引用)里。一个actor需要与外界隔离才能从actor模型中获益,所以actor是以actor引用的形式展现给外界的。
2、ActorSystem的层次结构
如果一个Actor中的业务逻辑非常复杂,为了降低代码的复杂度,可以将其拆分成多个子任务(在一个actor的内部可以创建一个或多个actor,actor的创建者也是该actor的监控者)
一个ActorSystem应该被正确规划,例如哪一个Actor负责监控,监控什么等等:
- 负责分发的actor管理接受任务的actor
拥有重要数据的actor,找出所有可能丢失数据的子actor,并且处理他们的错误。
3、ActorPath
ActorPath是通过字符串描述Actor的层级关系,并唯一标识一个Actor的方法。
ActorPath包含协议,位置 和 Actor层级关系
//本地path
"akka://my-sys/user/service-a/worker1" //远程path akka.tcp://(ActorSystem的名称)@(远程地址的IP):(远程地址的端口)/user/(Actor的名称)
"akka.tcp://my-sys@host.example.com:5678/user/service-b" //akka集群
"cluster://my-cluster/service-c"
远程地址不清楚是多少的话,可以在远程的服务启动的时候查看
4、获取Actor Reference
获取Actor引用的方式有两种:创建 和 查找。
要创建Actor,可以调用ActorSystem.actorOf(..),它创建的actor在guardian actor之下,接着可以调用ActorContext的actorOf(…) 在刚才创建的Actor内生成一个actor树。这些方法会返回新创建的actor的引用,每一个actor都可以通过访问ActorContext来获得自己(self),子Actor(children,child)和父actor(parent)。
要查找Actor Reference,可以调用ActorSystem或ActorContext的actorSelection(“path”),在查找ActorRef时,可以使用相对路径或绝对路径,如果是相对路径,可以用 .. 来表示parent actor。
actorOf / actorSelection / actorFor的区别
actorOf 创建一个新的actor,创建的actor为调用该方法所属的context的直接子actor。
actorSelection 查找现有actor,并不会创建新的actor。
actorFor 查找现有actor,不创建新的actor,已过时。
5、Actor和ActorSystem
Actor:
就是用来做消息传递的
用来接收和发送消息的,一个actor就相当于是一个老师或者是学生。
如果我们想要多个老师,或者学生,就需要创建多个actor实例。
ActorSystem:
用来创建和管理actor,并且还需要监控Actor。ActorSystem是单例的(object)
在同一个进程里面,只需要一个ActorSystem就可以了
三、Actor的示例
1、示例说明
2、代码实现
MyResourceManager.scala(服务端)
package com.rpc import akka.actor._
import com.typesafe.config.{Config, ConfigFactory} import scala.collection.mutable class MyResourceManager(var resourceManagerHostName:String, var resourceManagerPort:Int) extends Actor {
/**
* 定义一个Map,接受MyNodeManager的注册信息,key是主机名,
* value是NodeManagerInfo对象,里面存储主机名、CPU和内存信息
* */
var registerMap = new mutable.HashMap[String,NodeManagerInfo]()
/**
* 定义一个Set,接受MyNodeManager的注册信息,key是主机名,
* value是NodeManagerInfo对象,里面存储主机名、CPU和内存信息
* 实际上和上面的Map里面存档内容一样,容易变历,可以不用写,主要是模仿后面Spark里面的内容
* 方便到时理解Spark源码
* */
var registerSet = new mutable.HashSet[NodeManagerInfo]() override def preStart(): Unit = {
import scala.concurrent.duration._
import context.dispatcher
context.system.scheduler.schedule( millis, millis, self,CheckTimeOut)
} //对MyNodeManager传过来的信息进行匹配
override def receive: Receive = {
//匹配到NodeManager的注册信息进行对应处理
case NodeManagerRegisterMsg(nodeManagerID,cpu,memory) => {
//将注册信息实例化为一个NodeManagerInfo对象
val registerMsg = new NodeManagerInfo(nodeManagerID,cpu,memory)
//将注册信息存储到registerMap和registerSet里面,key是主机名,value是NodeManagerInfo对象
registerMap.put(nodeManagerID,registerMsg)
registerSet += registerMsg
//注册成功之后,反馈个MyNodeManager一个成功的信息
sender() ! new RegisterFeedbackMsg("注册成功!" + resourceManagerHostName+":"+resourceManagerPort)
}
//匹配到心跳信息做相应处理
case HeartBeat(nodeManagerID) => {
//获取当前时间
val time:Long = System.currentTimeMillis()
//根据nodeManagerID获取NodeManagerInfo对象
val info = registerMap(nodeManagerID)
info.lastHeartBeatTime = time
//更新registerMap和registerSet里面nodeManagerID对应的NodeManagerInfo对象信息(最后一次心跳时间)
registerMap(nodeManagerID) = info
registerSet += info
}
//检测超时,对超时的数据从集合中删除
case CheckTimeOut => {
var time = System.currentTimeMillis()
registerSet
.filter( nm => time - nm.lastHeartBeatTime > )
.foreach(deadnm => {
registerSet -= deadnm
registerMap.remove(deadnm.nodeManagerID)
})
println("当前注册成功的节点数:" + registerMap.size)
}
}
} object MyResourceManager {
def main(args: Array[String]): Unit = {
/**
* 传参:
* ResourceManager的主机地址、端口号
* */
val RM_HOSTNAME = args()
val RM_PORT = args().toInt val str:String =
"""
|akka.actor.provider = "akka.remote.RemoteActorRefProvider"
|akka.remote.netty.tcp.hostname =localhost
|akka.remote.netty.tcp.port=
""".stripMargin
val conf: Config = ConfigFactory.parseString(str)
val actorSystem = ActorSystem(Conf.RMAS,conf)
actorSystem.actorOf(Props(new MyResourceManager(RM_HOSTNAME,RM_PORT)),Conf.RMA)
}
}
MyNodeManager.scala(客户端)
package com.rpc import java.util.UUID import akka.actor._
import com.typesafe.config.{Config, ConfigFactory} class MyNodeManager(resourceManagerHostName:String,resourceManagerPort:Int,cpu:Int,memory:Int) extends Actor{
//MyNodeManager的UUID
var nodeManagerID:String = _
var rmref:ActorSelection = _
override def preStart(): Unit = {
//获取MyResourceManager的Actor的引用
rmref = context.actorSelection(s"akka.tcp://${Conf.RMAS}@${resourceManagerHostName}:${resourceManagerPort}/user/${Conf.RMA}")
//生成随机的UUID
nodeManagerID = UUID.randomUUID().toString
/**
* 向MyResourceManager发送注册信息
* */
rmref ! NodeManagerRegisterMsg(nodeManagerID,cpu,memory) }
//进行信息匹配
override def receive: Receive = {
//匹配到注册成功之后MyResourceManager反馈回的信息,进行相应处理
case RegisterFeedbackMsg(feedbackMsg) => {
/**
* initialDelay: FiniteDuration, 多久以后开始执行
* interval: FiniteDuration, 每隔多长时间执行一次
* receiver: ActorRef, 给谁发送这个消息
* message: Any 发送的消息是啥
*/
//定时任务需要导入的工具包
import scala.concurrent.duration._
import context.dispatcher
//定时向自己发送信息
context.system.scheduler.schedule( millis, millis, self, SendMessage)
}
//匹配到SendMessage信息之后做相应处理
case SendMessage => {
//向MyResourceManager发送心跳信息
rmref ! HeartBeat(nodeManagerID)
println(Thread.currentThread().getId + ":" + System.currentTimeMillis())
}
}
} object MyNodeManager {
def main(args: Array[String]): Unit = {
/**
* 传参:
* NodeManager的主机地址、端口号、CPU、内存
* ResourceManager的主机地址、端口号
* */
val NM_HOSTNAME = args()
val NM_PORT = args()
val NM_CPU:Int = args().toInt
val NM_MEMORY:Int = args().toInt val RM_HOSTNAME = args()
val RM_PORT = args().toInt val str:String =
s"""
|akka.actor.provider = "akka.remote.RemoteActorRefProvider"
|akka.remote.netty.tcp.hostname = ${NM_HOSTNAME}
|akka.remote.netty.tcp.port = ${NM_PORT}
""".stripMargin
val conf: Config = ConfigFactory.parseString(str)
val actorSystem = ActorSystem(Conf.NMAS,conf)
actorSystem.actorOf(Props(new MyNodeManager(RM_HOSTNAME,RM_PORT,NM_CPU,NM_MEMORY)),Conf.NMA)
}
}
Conf.scala(配置文件)
package com.rpc //避免硬编码
object Conf {
//ResourceManagerActorSystem
val RMAS = "MyRMActorSystem"
//ResourceManagerActor
val RMA = "MyRMActor"
//NodeManagerActorSystem
val NMAS = "MyNMActorSystem"
//NodeManagerActor
val NMA = "MyNMactor"
}
Message.scala
package com.rpc
//NodeManager注册信息
case class NodeManagerRegisterMsg(val nodeManagerID:String, var cpu:Int, var memory:Int)
//ResourceManager接收到注册信息成功之后的返回信息
case class RegisterFeedbackMsg(val feedbackMsg: String)
//NodeManager的心跳信息
case class HeartBeat(val nodeManagerID:String)
//NodeManager注册信息
class NodeManagerInfo(val nodeManagerID:String, var cpu:Int, var memory:Int){
//定义一个属性,存储上一次的心跳时间
var lastHeartBeatTime:Long = _
} case object SendMessage
case object CheckTimeOut
3、运行
(1)运行MyResourceManager
运行结果
发现报错数组越界,原因是在启动时需要传入2个参数
重新启动,启动成功
2、运行MyNodeManager
报相同的错误,不过此处需要传入6个参数
重新启动,启动成功
3、观察MyResourceManager
发现有一个节点连接成功
4、再启动一个MyNodeManager观察情况
先修改MyNodeManager配置里面的端口
再启动
启动成功之后观察MyResourceManager,此时有2个节点连接成功
5、关闭一个节点,观察情况
集合中连接超时的成功删除