Actor Model 与 Akka

少于 1 分钟读完

本文主要介绍在多线程环境中我们会遇到各种问题：死锁，阻塞，线程安全，异常丢失等，以及Actor Model如何处理这些问题。

传统多线程编程遇到的问题

之所以叫现代多线程解决方案，是因为它更加适合现代的硬件设备。以下介绍面向对象编程语言（OOP）在多线程环境下遇到的问题。

关于封装

OOP核心之一：封装。封装使对象中的数据不能直接被外部访问，并且只能被一组方法所更改，这样可以保证数据的安全性。假设一个调用链：

seq_chart

单线程环境下的执行示意图：

seq_chart_thread

多线程环境下的执行示意图：

seq_chart_multi_thread

很明显在多线程环境中，传统的封装并不能保证在两个线程同时进入方法时后发生的事情。为了解决这个问题，我们引入了一个代价非常高的解决方式：锁

锁严重的影响了并发性，并且在现代的CPU架构上代价非常高。
锁引入了一个新的问题：死锁。
在分布式系统中，锁存在一定的局限性。

关于共享内存

在现代CPU中每一个内核都有自己的缓存，而这个缓存对其它内核都是不可见的。在JVM中我们可以使用volatile标记或者Atomic包装来表示需要跨线程共享的内存位置。但是共享的代价非常高。在内核中的数据必须先刷入主存储器，其它内核每次使用时都需要从主存储器中取出。更多请了解缓存一致性协议（ cache coherence protocol）。

关于调用栈

调用栈是在一个并发编程并不重要的时代发明的，在那个时候多核CPU并不常见，因此并没有为异步调用考虑合适的调用模型。

问题出现在当一个线程打算委派任务给另一个线程时，通常是将对象放入由工作者线程共享的内存，再由工作者在某些事件循环中拾取，调用者便可返回继续进行其它任务。

第一个问题是，怎样通知调用者任务已经完成？但是更严肃的一个问题是当任务失败或者异常时，异常将会传播到哪里？它会传播给工作者线程的异常处理程序，而完全忽略了调用者是谁。

exception_prop

通常情况下工作者线程会无视任务的失败，它需要通过某种方式通知调用者线程，将错误代码放入调用者预先设定好的位置，如果没有这个通知，调用者将永远不会收到失败通知，任务就会丢失！

当出现问题时，情况会更加糟糕，例如：由BUG引起的内部异常冒泡到线程顶端，并使线程关闭。这引发了另一问题，由谁来重新启动工作者线程，以及恢复到正常状态？线程正在处理的任务已经不再位于共享的内存中（例如队列）。

Actor Model 如何处理这些问题

使用Actor Model允许我们：

在不使用锁的前提下还原封装
不需要担心程序的执行与我们想象的不同
使用协作实体对信号作出反应，改变状态，或者发送信号，以此来驱动程序的执行

使用消息传递来避免锁和阻塞

使用发送消息来替代方法的调用。在不阻塞，不转移线程的情况下发送一个消息到另一个方法。

serialized_timeline_invariants

当actor接收到消息时：

添加消息到队列的末尾
如果actor没有被安排执行，标记执行状态为就绪
一个隐藏的调度程序接收actor并执行
actor选取队列最前端的消息
actor修改内部状态并发送消息给其它actor

为了实现这些行为，actor需要：

一个消息接收器
状态和内部变量
数据消息，类似方法参数
执行环境，用于调用消息处理代码
地址

注： 1. 可以在几十个线程上有效的安排数百万个actor，充分发挥现代CPU的潜力。2. 相同的模型还可以应用在分布式系统中，将消息在网络中传输。

Actor优雅的错误处理方式

我们有两种错误需要考虑：

第一种是任务本身的错误，例如：验证不通过，不存在Id等。在这种情况下服务本身还是完整的，所以只需要使用正常消息回复。
第二种是服务本身的内部故障，Akka强制所有的actor组成一个树状结构，当一个actor创建另一个actor时，就会成为该actor的父级，当一个actor失败时，它的父级会得到通知，并可以作出反应。此外，如果父级已经停止，则其下所有actor也会被停止。这项服务叫做“监督”，也是actor的核心。

actor_tree_supervision

注：父级actor可以决定在某些故障中重启子actor。

Akka 官方介绍

Twitter Facebook LinkedIn

Timothy Ji

Actor Model 与 Akka

传统多线程编程遇到的问题

关于封装

关于共享内存

关于调用栈

Actor Model 如何处理这些问题

使用消息传递来避免锁和阻塞

Actor优雅的错误处理方式

分享

猜您还喜欢

AI 笔记

PyTorch Install

2022年的整年日记

WSL2