-
qexo_test
测试下。 aaa bbb 1 2 3 sdafsdf123123 -
Flink 系列
🔒 文章已加密,输入密码后才能查看。 -
test-page
TestThis is a test page 2024-04-15 这是第二个时间点的内容。 一级标题 二级标题 三级标题 列表1 2 3 4... -
ignite基础
一些简单操作记录1234567891011sqlline.py -u jdbc:ignite:thin://10.40.2.13:10800,10.40.2.14:10800,10.40.2.15:10800CREATE TABLE Person (... -
Spark_08_其他
1. spark的historyServer123456vim spark-defaults.confspark.eventLog.enabled truespark.eventLog.dir hdfs... -
Spark_07_spark streaming
一、实时流处理实时流处理,就是一种 处理连续、动态数据流的 计算技术,核心特点如下: 低延迟:数据输入后能够快速相应和处理 持续处理:能够连续处理无边界的数据流 动态计算:实时对数据进行分析、聚合和转换等 应用场景 实时推荐系统 金融交易监控 ... -
Spark_06_sparksql
一、 SparkSQL 介绍SparkSQL 是Spark 用来处理结构化数据的一个模块,可以通过SQL的方式访问和处理数据。它提供了一个叫做DataFrame的编程抽象结构数据模型,可以简单理解为 DataFrame = rdd + sc... -
Spark_05_spark打包运行
通常在开发的时候,会设置 master为 local,这样做是为了快速的在本地运行spark程序进行验证。 真实的工作中,开发完spark程序后,需要将程序打包并提交到集群中运行。 1. 打包程序 将 setMaster("local&qu... -
Spark_04_弹性分布式数据集介绍
Spark 围绕弹性分布式数据集(RDD)的概念展开,它是一组可以并行操作的容错元素集合。 创建 RDD 有两种方式:在驱动程序中并行化现有的集合,或者引用外部存储系统中的数据集,例如共享文件系统、HDFS、HBase 或任何提供 Hadoop I... -
Spark_03_工程开发
以 Spark Core 为例 1. 创建maven工程123456<!-- 需要引入spark-core的依赖 --> <dependency> <groupId>org.apache.spark...
We are all in the gutter, but some of us are looking at the stars.|