AKKA文档(java版)—容错

原文链接  译者:小鱼

正如角色系统这一章中解释的一样,每一个角色都是它孩子的监管者,并且像这样的角色都会定义错误处理监管策略。这个策略在成为角色系统结构的一个完整部分之后是不能被改变的。

错误处理实践

首先,让我们看一个处理数据存储错误的例子,它是实践应用中一个典型的错误根源。当然它基于真实应用,这个应用的数据存储有可能是无效的,但我们在这个例子中会用一个最有效的重连方法来实现。
读下面的源代码。内嵌的注释解释了错误处理的不同块和为什么要添加它们。强烈的建议去运行这个例子,这样才能更简单的去跟踪这个日志输出,来了解运行的时候发生了什么。

容错例子的图解(Diagrams of the Fault Tolerance Sample)
容错例子的全部源代码(Full Source Code of the Fault Tolerance Sample)

创建一个监管策略

下面的章节解释了错误处理机制和更深入的选择。
根据示范的目的,让我们来考虑如下策略:

private static SupervisorStrategy strategy =
new OneForOneStrategy(10, Duration.create("1 minute"),
new Function<Throwable, Directive>() {
@Override
public Directive apply(Throwable t) {
if (t instanceof ArithmeticException) {
return resume();
} else if (t instanceof NullPointerException) {
return restart();
} else if (t instanceof IllegalArgumentException) {
return stop();
} else {
return escalate();
}
}
});

@Override
public SupervisorStrategy supervisorStrategy() {
return strategy;
}

我选择了一些大家熟知的异常类型,是为了展示在监管和监视章节中描述的错误处理指令的应用。首先,它是一个一对一的策略,意味着每一个孩子都是分开处理的(多对一的策略工作非常类似,唯一的不同就是任何决策都会应用到监管者的所有孩子,不仅仅是发生错误的那个)。在重启频率上会有一些限制,最大是每分钟重启10次。-1和Duration.Inf()意味着限制没有应用,抛开这个可能性,去指定一个绝对的上限或者去让这个重启的工作没有上限。当超出这个限制,孩子角色就被停止。

注意:如果策略在监管角色(而不是一个单独的类)中描述了,它的决策者可以在线程安全的形势下访问角色的所有内部状态,包括获得当前发生错误的孩子的引用(例如错误消息的getSender)。

默认监管策略
如果定义的策略没有覆盖抛出的异常,Escalate会被使用。当没有为一个角色定义监管策略,如下的异常会按照默认来处理:
1. ActorInitializationException会停止发生错误的子角色
2. ActorKilledException会停止发生错误的子角色
3. Exception会重启发生错误的子角色
4. 别的抛出类型会升级到父角色
如果异常升级到根监管者,会按上述的默认策略处理。

停止监管策略

跟Erlang方式类似的策略是当它们失败的时候只停止子角色,以及当DeathWatch通知丢失的子角色的时候会对监管者采取正确的动作。

记录角色失败的信息

默认SupervisorStrategy会记录失败信息除非它们被向上升级。建议在更高层次的结构中处理上升的错误,并潜在的记录下来。
在初始化的时候你可以通过设置SupervisorStrategy的loggingEnabled为false来去掉默认的日志。可以在Decider里定制日志。注意如getSender一样,当SupervisorStrategy在监管角色中描述,当前失败的子角色引用是有效的。
你可以通重写logFailure方法在你自己的SupervisorStrategy实现中定制化日志。

最高层次角色的监管

最高层次角色意味着它们是通过system.actorOf()创建的,并且它们是User Guardian的孩子。在这种情况下没有特定的规则,守护者仅仅应用配置策略。

测试应用

下面章节展示了实践中不同指令的效果,wherefor测试启动是需要的。首先,我们需要一个匹配的监管者。

public class Supervisor extends UntypedActor {

private static SupervisorStrategy strategy =
new OneForOneStrategy(10, Duration.create("1 minute"),
new Function<Throwable, Directive>() {
@Override
public Directive apply(Throwable t) {
if (t instanceof ArithmeticException) {
return resume();
} else if (t instanceof NullPointerException) {
return restart();
} else if (t instanceof IllegalArgumentException) {
return stop();
} else {
return escalate();
}
}
});

@Override
public SupervisorStrategy supervisorStrategy() {
return strategy;
}

public void onReceive(Object o) {
if (o instanceof Props) {
getSender().tell(getContext().actorOf((Props) o), getSelf());
} else {
unhandled(o);
}
}
}

这个监管者会被用于创建子角色,我们可以实验一下:

public class Child extends UntypedActor {
int state = 0;

public void onReceive(Object o) throws Exception {
if (o instanceof Exception) {
throw (Exception) o;
} else if (o instanceof Integer) {
state = (Integer) o;
} else if (o.equals("get")) {
getSender().tell(state, getSelf());
} else {
unhandled(o);
}
}
}

测试使用Testing Actor Systems里介绍的实用工具会比较简单,TestProbe提供一个Actor Ref用于接收和检查消息回复。

import akka.actor.ActorRef;
import akka.actor.ActorSystem;
import akka.actor.SupervisorStrategy;
import static akka.actor.SupervisorStrategy.resume;
import static akka.actor.SupervisorStrategy.restart;
import static akka.actor.SupervisorStrategy.stop;
import static akka.actor.SupervisorStrategy.escalate;
import akka.actor.SupervisorStrategy.Directive;
import akka.actor.OneForOneStrategy;
import akka.actor.Props;
import akka.actor.Terminated;
import akka.actor.UntypedActor;
import scala.collection.immutable.Seq;
import scala.concurrent.Await;
import static akka.pattern.Patterns.ask;
import scala.concurrent.duration.Duration;
import akka.testkit.AkkaSpec;
import akka.testkit.TestProbe;

public class FaultHandlingTest {
static ActorSystem system;
Duration timeout = Duration.create(5, SECONDS);

@BeforeClass
public static void start() {
system = ActorSystem.create("test", AkkaSpec.testConf());
}

@AfterClass
public static void cleanup() {
JavaTestKit.shutdownActorSystem(system);
system = null;
}

@Test
public void mustEmploySupervisorStrategy() throws Exception {
// code here
}

}

让我们创建角色

Props superprops = Props.create(Supervisor.class);
ActorRef supervisor = system.actorOf(superprops, "supervisor");
ActorRef child = (ActorRef) Await.result(ask(supervisor,
Props.create(Child.class), 5000), timeout);

第一个测试会演示Resume指令,所以我们尝试通过把角色的状态设置成非初始化状态并让它失败:

child.tell(42, ActorRef.noSender());
assert Await.result(ask(child, "get", 5000), timeout).equals(42);
child.tell(new ArithmeticException(), ActorRef.noSender());
assert Await.result(ask(child, "get", 5000), timeout).equals(42);

你可以看到值42让错误处理指令存活下来。现在,如果我们把错误改成一个更严重的NullPointerException异常,则将不会是这种情况:

child.tell(new NullPointerException(), ActorRef.noSender());
assert Await.result(ask(child, "get", 5000), timeout).equals(0);

发生IllegalArgumentException致命异常的情况下,最终会导致子角色会被监管者中断:

final TestProbe probe = new TestProbe(system);
probe.watch(child);
child.tell(new IllegalArgumentException(), ActorRef.noSender());
probe.expectMsgClass(Terminated.class);

到目前为止,监管者还没有完全受到子角色失败的影响,因为指令集会处理它。万一抛出一个异常,监管者会向上抛出错误。

child = (ActorRef) Await.result(ask(supervisor,
Props.create(Child.class), 5000), timeout);
probe.watch(child);
assert Await.result(ask(child, "get", 5000), timeout).equals(0);
child.tell(new Exception(), ActorRef.noSender());
probe.expectMsgClass(Terminated.class);

监管者自己是由ActorSystem提供的最高等级的角色监管的,在所有的异常(注意这两个异常

ActorInitializationException和ActorKilledException)情况下,默认策略是重新启动。一旦默认的指令重启去杀死所有的孩子,我们期望我们的穷孩子不要幸存这个错误。

这不是所希望的(这依赖于用例),我们需要去用一个不同的监管者重写这个行为。

public class Supervisor2 extends UntypedActor {

private static SupervisorStrategy strategy = new OneForOneStrategy(10,
Duration.create("1 minute"),
new Function<Throwable, Directive>() {
@Override
public Directive apply(Throwable t) {
if (t instanceof ArithmeticException) {
return resume();
} else if (t instanceof NullPointerException) {
return restart();
} else if (t instanceof IllegalArgumentException) {
return stop();
} else {
return escalate();
}
}
});

@Override
public SupervisorStrategy supervisorStrategy() {
return strategy;
}

public void onReceive(Object o) {
if (o instanceof Props) {
getSender().tell(getContext().actorOf((Props) o), getSelf());
} else {
unhandled(o);
}
}

@Override
public void preRestart(Throwable cause, Option<Object> msg) {
// do not kill all children, which is the default here
}
}

通过父亲,孩子角色幸存向上升级重启,如最后一段测试代码所演示的:

superprops = Props.create(Supervisor2.class);
supervisor = system.actorOf(superprops);
child = (ActorRef) Await.result(ask(supervisor,
Props.create(Child.class), 5000), timeout);
child.tell(23, ActorRef.noSender());
assert Await.result(ask(child, "get", 5000), timeout).equals(23);
child.tell(new Exception(), ActorRef.noSender());
assert Await.result(ask(child, "get", 5000), timeout).equals(0);

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/119996.html

(0)
上一篇 2021年8月28日
下一篇 2021年8月28日

相关推荐

发表回复

登录后才能评论