IT技术之家

首页 > 数据库

数据库

  • Spark 部署 Standalone 模式_cpuCode

    Spark 部署 Standalone 模式解压缩文件修改配置文件启动集群Web UI 界面提交应用提交参数说明配置历史服务配置日志存储路径添加日志配置重启动 Hadoop 集群重启动历史服务重新执行任务查看历史服务配置高可用(HA)集群规划 :停止集群启动 Zookeeper启动集群关闭集群关闭历史服务 :解压缩文件将 spark-3.0.0-bin-hadoop3.2.tgz 文件上传到 Linux 并解压缩在指定位置tar -zxvf spark-3.0.0-bin-hadoop3.2.tgz


    标签: sqoop 数据仓库 mysql hadoop 大数据
  • 一篇文章搞懂数据仓库:四种常见数据模型(维度模型、范式模型等)_维度表雪花模型_长弓霄

    DataVault由Hub(关键核心业务实体)、Link(关系)、Satellite(实体属性) 三部分组成 ,是Dan Linstedt发起创建的一种模型方法论,它是在ER关系模型上的衍生,同时设计的出发点也是为了实现数据的整合,并非为数据决策分析直接使用。特点:设计思路自上而下,适合上游基础数据存储,同一份数据只存储一份,没有数据冗余,方便解耦,易维护,缺点是开发周期一般比较长,维护成本高。星型模型可以理解为,一个事实表关联多个维度表,雪花模型可以理解为一个事实表关联多个维度表,维度表再关联维度表。


    标签: 数据仓库 大数据
  • clickhouse数据处理_clickhouse 明细记录_cxscode

    建表CREATE TABLE log_db.event_log( `ename` String, `app_id` UInt64, `channel` String, `source` String, `platform` String, `openid` String, `order_id` String, `server_id` String, `server_name` String, `imei` String,


    标签: sql 数据仓库
  • 疫情分析项目_zhang_csdn999

    疫情期间各类政府媒体及社交网站,均发布了相关疫情每日统计数据,下面基于数据仓库工具Hive请你统计分析相关疫情数据。数据字段为:日期、省份、城市、新增确诊、新增出院、新增死亡、消息来源、来源1,来源2,来源3请在hdfs根目录下中创建一个目录,以你的小组名称英文全拼命名_data,并将以上疫情数据上传到这个目录中,截图成功后结果请你在hive中创建数据库名为: ods_yiqing_data,并切换使用这个数据库,截图成功后结果创建一个hi...


    标签: 数据仓库 hive hadoop
  • 3分钟搞懂中台_孙中明

    文章目录什么是数据中台?背景作用定义中台类型有哪些?业务数据双中台技术中台研发中台移动中台管理中台组织中台企业为什么要建中台?需求变了匹配失衡鱼和熊掌成功的中台推荐阿里数据中台网易业务中台百度AI 中台……最后什么是数据中台?背景2015年全年产生的数据量等于历史上所有人类产生数据的总和,人类的数据增长正式从乘法型增长变成了指数型增长,海量数据处理成为了全人类的挑战。阿里提出了DT时代已经到来:DataTech替代ITTech,强调数据驱动的重要性。阿里走在了前面,阿里用几百人的团队支撑了几万亿


    标签: bigdata 数据仓库 阿里云
  • 数仓学习笔记_主题域和业务域_nijialong11

    1.数据处理方式数据处理方式主要有两种,OLAP和OLTP联机事务处理OLTP(on-line transaction processing) 联机分析处理OLAP(on-line analyticalprocessing)OLTP要求遵循ACID原则,是针对事务管理的处理方式,要求快速响应,当前数据量相对较小,但是每天生成的日志数据会很大,主要关注增删改查,典型的例如Mysql。 OLAP分析速度相对较慢,历史数据量大,查询频率相对较低,处理结果提供给分析决策人员使用,是一个多维模型。.


    标签: 数据库 sql 数据仓库
  • 数据仓库,数据集市,数据孤岛,数据湖,数据中台_gscloud

    数据仓库,数据集市,数据孤岛,数据湖,数据中台文章目录数据仓库,数据集市,数据孤岛,数据湖,数据中台1.数据仓库2.数据集市3.数据孤岛4.数据湖5.数据中台1.数据仓库定义:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理中的决策制定作用数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改这解释一下主题和主题域


    标签: 大数据 数据仓库 数据分析 数据挖掘
  • 主流的商业智能BI工具推荐,学会数据分析没难度_明月说数据

    伴随着大数据概念的深入企业越来越重视大数据,商业智能BI工具已经成为许多企业数据分析的首选。也许有些小伙伴对商业智能BI工具还是有些陌生,在了解商业智能BI工具之前,先来了解一下什么是商业智能。百度百科解释是商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。商业智能是收集、管理和分析商业信息的过程,旨在使企业的各级决策者通过数据分析提升洞察力,促使他们做出更有利于企业发展的决


    标签: bigdata 人工智能 BI工具
  • inceptor手册_inceptor数据库_TBon-

    inceptor手册inceptor基础对象数据库表托管表外表text表csv表ORC表holodesk表分区表分桶表视图inceptor基础对象数据库,表,视图,函数;对象的元数据保存在inceptor metastore,数据库对象内的数据在 内存或SSD中(Holodesk表)HDFS(text表/orc表/csv表)数据库数据库是存放一组表的目录可以使用beeline -u “jdbc:hive2://<server_ip/hostname>:10000/"指


    标签: 数据仓库
  • 数仓之订单事实表【累积型快照事实表】_订单交易事实表_阿航再努力ing...

    数仓之订单事实表【累积型快照事实表】1.创建订单事实表DWD订单事实表(累积型快照事实表)drop table if exists dwd_fact_order_info;create external table dwd_fact_order_info ( `id` string COMMENT '订单编号', `o


    标签: hive 数据仓库 hql
  • DataPipeline官宣:前Teradata中国区金融行业总经理黄海硕出任DataPipeline高级销售副总裁_DataPipeline数见科技

    ?2022年开年,DataPipeline正式官宣,公司迎来一位重量级高管:前Teradata中国区金融行业总经理黄海硕出任DataPipeline高级销售副总裁。


    标签: 金融 数据仓库 数据管理
  • 数据湖05:从数据仓库看数据湖_数据仓的schema特性_YoungerChina

    数据湖和数据仓库,不能说谁更好谁更差,大家都有可取之处,可以实现双方的优势互补。


    标签: 数据湖 数据仓库
  • Kyligence + Tableau 统一语义层赋能数据分析平民化_Kyligence

    前言大家都知道,数据分析项目从需求提出到最终交付要经历一个漫长的过程,需要进行数据源整合、指标定义、模型开发、数仓任务开发及运维、报表开发等一系列环节,开发周期动辄都是以周为单位,而且业务场景也并非一成不变,一旦发生指标逻辑的变更,数仓就要重新开发刷数,这让需求和开发两方本就紧张的关系更加“雪上加霜”。总结起来,就是当下 BI 使用中的痛点: 数据加工链路长,灵活性差 PB级数据难以实现秒级响应能力 数据来源繁杂,缺乏统一语义管理能力 指标数量越来越多,达到上千甚..


    标签: 数据分析 bigdata 数据仓库
  • 数仓建模—OneID落地实践_python 客户oneid_不二人生

    OneID前面我们学习了ID Mapping,包括ID Mapping 的背景介绍和业务场景,以及如何使用Spark 实现ID Mapping,这个过程中涉及到了很多东西,当然我们都通过文章的形式介绍给大家了,所以你再学习今天这一节之前,可以先看一下前面的文章Spark实战—GraphX编程指南数仓建模—ID Mapping(上)数仓建模—ID Mapping(下)在上一节我们介绍ID Mapping 的时候我们就说过ID Mapping 是为了打通用户各个维度的数据,从而消除数据孤岛、避免


    标签: spark 数据仓库 数仓建模 数据建模 面试
  • 数据治理——数据安全_数据安全治理_IT_心如止水

    上一篇主要聊了聊数据质量保障的原则和常见的监控规则,但是,仅仅依靠这些就可以做好数据的质量管理吗?显而易见,是不太可能。那么,今天,就继续深入聊一聊数据质量管理。


    标签: 大数据 数据仓库