面试题三

问题:为什么使用Flink替代Spark?

解答:教材里面有Flink和Spark的详细对比。

一,Flink是真正的流处理,延迟在毫秒级,Spark Streaming是微批,延迟在秒级。

二,Flink可以处理事件时间,而Spark Streaming只能处理机器时间,无法保证时间语义的正确性。

三,Flink的检查点算法比Spark Streaming更加灵活,性能更高。Spark Streaming的检查点算法是在每个stage结束以后,才会保存检查点。

四,Flink易于实现端到端一致性。