-
Spark_02_快速上手
1. spark 的安装如果在一个没有安装过Spark的系统中,需要安装Spark的话,可以遵循以下步骤 需要注意 Spark 和 hadoop 有版本对应关系 下载安装包 上传并解压 2. 进入Spark的交互式终端12345678910111... -
Spark_01_基本介绍
官网:https://spark.apache.org/ spark 系列配套代码地址: https://github.com/Cheers0606/spark-learing.git Spark 是一个支持 多语言 客户端开发 的 基于内存... -
iceberg
Iceberg is a high-performance format for huge analytic tables. Iceberg brings the reliability and simplicity of SQL tables t... -
Docker和容器化
一、虚拟机和容器1.1 虚拟化和虚拟机虚拟化是一种通过软件层面创建虚拟资源(计算、存储、网络等)的技术。 虚拟机是通过软件创建出来一些虚拟的资源,从而在这些虚拟的资源上安装的操作系统。 VMware就是管理和创建虚拟机的软件,在VMware中,我们可... -
标签体系改造-TEST-nested
创建mapping并插入数据123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960... -
标签体系改造-TEST
测试创建es mapping123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960... -
标签体系改造
标签体系ES存储方案(es v5)设置分词器123456789101112{ "settings": { "analysis": { "analyzer... -
Elasticsearch-1
巨人的肩膀1 巨人的肩膀2 es文档模型segment 段 –> Lucene 索引 –> shard 分片 –> index 涉及操作 创建索引 PUT /indexname 设置分片数量 PUT settings... -
标签体系一些坑
平台侧标签树类型 更新标签树类型的任务(update_tree_type)每晚定时更新,可能不及时 更新任务可能出错,导致es中info没有数据,但是打标签流程正常,则label_default会有数据。导致 1. 用户平均标签有问题 2. 人群...