数据分析与可视化的基础材料:从二维表与多维表的细分谈起
type
status
date
slug
summary
tags
category
icon
password
本期文章是Power Query 系列的第一篇文章,我们从二维表和多维表的认知谈起,这是我们后面进行数据分析绕不开的一个最为基础的认知,那么在数据分析领域,或者在PowerBI、Power Query这类软件中,二维表、三维表或者多维表,这些概念究竟是怎么来区分和定义的?数据清洗阶段又怎么来操作,并且需要达到什么样的标准?
二维表 - 数据的“原材料”
二维表是我们最熟悉、最基础的表格形式,也是所有数据分析的起点。我们进行数据清洗的目标也是为了把数据整理成一个计算机能够理解和分析的“标准二维数据表”(也称为Tidy Data)!
二维数据表:一个由行 (Rows) 和 列 (Columns) 构成的平面结构。每一行代表一个独立的记录(比如一笔交易、一个员工),而每一列则定义这个记录的一个属性(比如交易的金额或者时间、员工的姓名或年龄)。
Power Query 的核心工作空间就是二维表。它的所有操作——无论是删除列、筛选行、更改数据类型,还是合并、追加、拆分——都是在对一个或多个二维表进行处理,他最终的输出结果也永远是一个干净、规整的二维表。
Power Query它的唯一任务就是把各种形状不一(大量合并单元格或者为了满足人类视觉需要而制作的静态多维表格)的“原材料”,通过填充、替换值、透视列、逆透视列、转置、拆分列等一系列的转换操作,加工成标准化的“零件”(干净的二维表),以供后续使用。并且只要这个源格式没有变化,那么这一系列的操作(冻结成标准工序)都会记录在案,下次只要把同样的原始表导入,Power Query就会瞬间将其整理好,非常高效,可以视作是一个高度自动化的数据清洗工厂。
Power Query 的角色:二维表的“工匠”
- 输入:各种混乱的二维表。
- 工作:通过 ETL (提取、转换、加载) 过程,创建出两种非常重要的、标准化的二维表:
- 事实表 (Fact Table): 存放度量和与维度表关联的“外键”。通常行数非常多,很长。例如,一笔笔的销售记录表。
- 维度表 (Dimension Table): 存放维度的具体信息。通常行数较少,很宽。例如,产品信息表、客户信息表、日期表。
- 输出:一组干净、独立的、符合“星型模型”或“雪花模型”规范的二维表。
- 结论:Power Query 的世界里只有二维表。它的目标就是为构建多维模型提供最优质的二维“建材”。
我们最终用来分析的数据,几乎总是以二维表(或一组相关的二维表)的形式存在的。
这是因为:
- 主流数据存储系统的基础:无论是关系型数据库(如SQL Server, MySQL)、电子表格(Excel, Google Sheets),还是最常见的数据交换文件(CSV, TXT),它们存储和组织数据的基本单位就是二维表。这是几十年来经过验证的最成熟、最高效的数据组织方式。
- 分析工具的“通用语言”:像Power Query, Power BI, Tableau, Python (Pandas), R等所有主流数据分析工具,它们内部处理数据的核心数据结构就是二维表(在Pandas中称为DataFrame)。它们的所有功能都是围绕着操作这个二维结构来设计的。
- 人类理解的直观性:行和列的结构非常符合人类的认知习惯,易于阅读和理解。
三维表&多维表-分析的“逻辑模型”
这里所说的“维”其实已经不再像二维表那样,有物理上实际存在的行、列、高,并不是这样的,而是指分析数据的角度。多维表不是一个真实存在的、你看得见的“表格”,而是一个概念模型,可以被称为一种数据形式的立方体 (Data Cube)。它没有单一的物理形态。你无法在 Excel 中直接“画”一个立方体,它的实现依赖于不同的数据查询角度的组合。
举一个直观的例子,我们在Excel中经常会使用数据透视表的功能,相信大部分朋友有过使用经验,假设你有一个关于产品销售额的二维表,每一行代表一条产品的交易记录,每一列代表记录这条交易记录的属性值,分别有这条交易所属的“销售区域”、“产品类别”、销售时间、“销售额”。
你用这个二维表来,创建一个数据透视表:
- 行区域:拖入 [销售区域] 维度。
- 列区域:拖入 [产品类别] 维度。
- 值区域:放入 SUM([销售额]) 度量值。
- 筛选器区域:放入 [销售时间] 维度。
此时,你看到的是一个交叉表。这个交叉表就是多维模型的一个二维投影或者快照视图,它清晰地展示了至少两个维度(销售区域、产品类别)是如何交叉影响一个度量(销售额)的,当你再去调整筛选器里的销售时间时,就在第三个维度上进行了交互,这个时候出来的数据模型,或者说这个立方体,实际上就是一种多维表了。
三维表 vs. 多维表:
- 三维表是多维表的一个特例,指恰好有三个维度。比如,按 [时间]、[地区]、[产品] 三个维度分析 [销售额]。这个概念有助于我们形象地理解数据立方体。
- 多维表是更通用的说法,可以有任意多个维度(二维、三维、四维……)。
这样,我们可以在一个二维的平面上,执行一个具有多维逻辑的、临时性的查询,然而数据透视表或者数据透视图是存在于Excel这个平台的,其处理数据的能力有限,并且是临时性的拖拉拽,而形成一个可供临时查阅的数据,无法进行更进一步的操作!
那么这个时候Power BI就出现了,在Power BI中,这个概念被发挥到了极致。整个数据透视模型,可以被固化成一个强大的、后台的多维立方体,通过这个立方体生成的每一个图表,都是对这个立方体进行查询后得到的一个漂亮的、二维或多维的可视化结果。
总结
特性 | 二维表 (2D Table) | 多维模型 (Multi-dimensional Model) |
核心概念 | 行与列构成的平面结构 | 度量与维度构成的逻辑立方体 |
目标 | 存储原始或处理后的数据记录 | 便于从多角度进行聚合、钻取和切片分析 |
在工具中的体现 | Power Query 的操作对象和输出结果 | Power BI 数据模型 (通过关系和DAX构建) |
如何交互 | 通过筛选、排序等直接操作 | 通过报表中的图表、矩阵、切片器进行交互式查询 |
比喻 | 建筑用的标准砖块 (事实表/维度表) | 用砖块搭建起来的整栋大楼 (数据模型) |
写在最后
所以,可以这样说,在数据分析的世界里,所有操作的结果最终都通向二维表。正如上面列举,我们获取的原始数据大部分是二维表,即使遇到不是的,我们的首要任务也是利用工具(如Power Query)将其转化为标准的二维表,以便进行后续的分析和建模。
当我们想查看某个多维数据模型表的具体某个值是怎么构成的时候,我们也是将其转换成二维表来进行阅读的,最典型的例子就是比如上面我们提到的数据透视表,如果我们想查看这个模型下的某个具体金额的构成,只需要在Excel中双击这个数字,然后系统会自动生成一个新的工作表(二维数据表)来进行展示的。
别忘了点赞、转发、推荐、关注,让更多财会同行、创业者看到!关注【汪斌带你开公司】,创业路上财税护航,不迷路!
上一篇
PowerBI、PowerQuery中什么是事实表和维度表?
下一篇
学习PowerBI之前先接触Excel的三大高级功能:Power Query、Power Pivot、Power View
Loading...
完全免费、无需编程基础,使用 Notion + GitHub + Vercel 来搭建网站(博客)的教程。
Power Query (M语言) 中,如何从三大核心容器(列表、记录、表)中获取数据(钻取)?
FAQ 001:Power Query (M语言) 中,[]和{}在不同场景下两种用法
FAQ 002:为什么[]取列值和{}取行值图标不一样,展示形式一样但是实质却是不一样的?
FAQ 003:为什么[]取列值和{}取行值展示形式都是竖着的,好像都是列一样?
FAQ 004:使用[]和{}能取多列、多行吗?
课程详细介绍文章(699包年)
为什么财务用Excel就够了,不必非Power BI不可?
建立基于PQ查询生成的透视表,如何避免生成新查询?
一维表和二维表的定义及转换
不懂成本,别做经营分析!4大业务场景下,成本核算和经营分析该如何深度融合?
Power Query功能详解之追加查询
经营分析:运用“道、法、术、器、人”思维模式,一切都想通了
VLOOKUP的致命硬伤以及PQ合并查询如何来拯救?
PowerQuery合并查询的6大连接神器详细解读:左外、右外、完全外、内部、反左、反右
存货计价核算:移动加权平均之美
一文讲透!约当产量法的实务运用,只讲能落地的干货!
成本归集的“最小单元”之争:生产工单、批次、还是工序?
制造业成本核算:“跑成本”背后的常见问题答疑
助力销售,财务如何解忧?
销售定价测算,怎么做?
系统“跑成本”的背后,都在干哪些活?
制造业成本核算与经营分析融合:了解“跑成本”的深刻含义
为什么仓库月末盘点需要财务一起?在一个上线了WMS系统的制造业企业,财务和仓管一起盘点需要注意什么?
出库单如何影响成本核算?
探讨材料毛利/率和材料边际贡献/率
销售预算编制:从战略解码到行动计划的8步闭环,建议收藏!
生产成本预算三大标准:单耗、能耗、工时
制造业的成本核算和经营分析怎么结合起来?
制造业成本核算的10个细节
Power Query功能详解之追加查询和合并查询
成本核算的核心步骤:定义规则、归集分配、计算与分析
财务BP的数据分析和可视化洞察报告究竟怎么做?CRISP-DM模型运用!
PowerQuery功能详解之追加查询和合并查询
浅谈实际成本法与标准成本法的双轨管理
为何Power Query做数据清洗能够一劳永逸?
不同类制造业,成本核算方法如何选择匹配?(核算对象和程序角度)
建议收藏!资深财务BP总结:经营分析报告行文与数据表达标准
Power Query数据清洗查询后,上载出来的报表与普通表的不同之处
PowerQuery功能详解之逆透视列和透视列
PowerQuery功能详解之添加自定义列
PowerBI、PowerQuery中什么是事实表和维度表?
数据分析与可视化的基础材料:从二维表与多维表的细分谈起
学习PowerBI之前先接触Excel的三大高级功能:Power Query、Power Pivot、Power View
为什么PowerBI是最合适的可视化数据分析软件?
财务BP岗位分析(芯碁微装)
“百日攻坚”别再空喊!这套“短平快”的财务组合拳,是年底冲刺真正奏效的真功夫!
财务BP和CFO的联系与区别
一张图,讲透顶尖制造企业的“成本精细化”管理蓝图!
读懂中小企业老板:只有这5件事和3个字!
全面预算管理执行层面的具体实施步骤(以系统执行为例)
“历史的锅,我不背!”——当新任主管遇上糊涂账,财务BP如何“三步走”平息风波?
财务BP岗位角色深度调查分析(价值百万)
关于滚动预算的10个灵魂拷问,没琢磨清楚千万别贸然下手!
告别“大水漫灌”式的成本分摊:用作业成本法,构建“成本精准滴灌”系统
CEO最需要的8个管理会计工具,让你从“记账员”秒变“军师”
别再“业财两张皮”,“管理会计体系”+“财务BP”这套组合拳,必须打!
一年躺“烧”250万!库存持有成本的核算与分析
亏损订单该不该接?算清边际贡献,结果可能颠覆你的认知
别再只报“实际成本”了!那不是成本分析,而是在“开盲盒”!
别只看毛利!算上总部费用分摊,才能看清产品的真正盈利能力
一次讲透在产品与完工成本的分配:破解制造业成本核算的“切蛋糕”难题
揭秘成本失真的头号元凶:一个让所有生产经理背锅的财务漏洞
别让生产车间再“背锅”:“成本反向还原”,找到真正的成本黑洞!
端到端成本核算全流程解析(总括篇)
从“费用预算”走向“全面预算”,需要怎样的信息化系统支撑?
如何从“费用预算”走向“全面预算”?
做了成本、费用预算,为什么还要做资金预算?
制造业生产成本预算如何编制?
报表分析框架:“三表联动”穿透分析法
出口退税:一次架构调整,挽回百万损失(续篇)
构建成本管控体系,用PRISM (方针-常规-检查-监督-衡量) 模型
出口退税:一次架构调整,挽回百万损失
实务中一般借款利息资本化金额怎么算?一文搞懂(附Excel套用模板)
一个案例拆解:现金流量折现估值模型
不同汇报场合,如何选用分析和叙事模型?
深扒之后,才发现净利润和现金流本就是一对“孪生兄弟”!
财务BP最爱的12个结构化拆解和叙事模型(附可套用模板)
冲压件成本、定价快速测算模型(私信获取)
从毛利到净利的分层递进分析3步法
应收账款洞察,五步法深度分析框架
老板们,别只盯着房产了!你公司最“值钱”的隐形资产,可能正躺着睡大觉
承兑汇票该不该收?如何消化?一文说明清楚!
一开始就准备申报高企的公司财务核算体系如何搭建?
保本点测算,一键搞定敏感性分析(模拟运算表)
Excel模拟运算表-财务测算敏感性分析的利器
制造业生产现场如何塑造成本核算?
更精准的成本核算支撑,BOM的分层管理及业务模式匹配
数字化转型背景下,制造业企业如何做好成本核算?
年终结账前哨战,一场精益求精的存货盘点工作,该如何计划和实施?
精准、高效的成本结账来自高效地跨部门协同
财务BP日记:制造业成本核算的起点是多去现场逛一逛
一杯咖啡背后的制造业成本核算逻辑
财务BP的经营分析会报告该怎么搭建?
半年度经营分析会,老板最关心的几个问题以及作为财务BP的你,如何应对?
制造业财务对MES系统的核心诉求?
差旅费审核:三大原则搞定“糊涂账”
把制造业成本算清楚的5个“命门”
财务BP必须修炼的PPT自动生成技术进阶版(思维与实操)
财务BP必须修炼的“端到端思维”
三只松鼠港股IPO:二次创业与价值重塑
溜溜梅的“二次创业”与价值重塑
溜溜梅IPO招股书财务分析(收藏)
快消食品制造业的四轮驱动财务管理模式
从三只松鼠、溜溜梅聚焦快消食品行业
风险扫描之增值税专用发票用量变动异常
数据分析三大思维:对比、分群、相关(附Excel表样模板)
第六波浪潮下,“数据+算力”正决定企业生死存亡!不只是口号!
在不确定的市场中,CFO们最担心什么
财务部各岗位“特写”
如何打造能够快速产出管理报告的核算体系?
财务BP做经营分析的三重境界
酒店行业预算怎么做?
车企的60天账期承诺:能否终结“羊毛出在猪身上,狗来买单”的逻辑?
产品定价测算的必要性和方法论(附Excel定价模型)
美的集团费用管理的7大核心
搭建财务分析数据指标体系(以蔚来汽车为例)
多产品保本点(本量利)分析,思路与Excel模板
续:投资回报率(ROI)测算模板使用指南
白话所得税:常见的应纳税暂时性差异
白话所得税:常见的可抵扣暂时性差异
白话所得税永久性差异,常见类型有哪些?
白话所得税资产与所得税负债
车间技改等资本性支出投资回报(ROI)测算分析(思路与Excel套表模板)
1.66亿!又有上市公司公告补交税款及滞纳金了!为何近年频发?
18万亿市场规模背后的驱动力量,杜邦分析模型的极致运用
费用预算:如何从控制思维向投资思维转变?
经营分析报告可视化图表应用指南(附1000套Excel模板)
经营分析报告中的变动率陷阱与解决方案
保本点敏感性分析:思路与Excel模板
关于非货币性资产对外投资的企业所得税递延纳税处理,一文彻底搞懂!
制造业年度预算环节业财融合怎么做?10年财务BP的几点思路
经营分析会开成了批斗大会,业务不懂财务,财务不理解业务,该如何破局?
领导力培训,团队管理技术,无私分享笔记
现金流 vs 净利润
告别“刀尖舔血”:当税务筹划从“护城河”变成“标靶”
代理出口模式退税,代理企业和生产企业的资金流、发票流、货物流,账务、税务如何处理?一文搞懂!
“签”万别大意!财务BP的制造业合同审核“必读文章”
经营分析会上,为什么毛利率比净利率更多地被提到?皮之不存,毛将焉附!
“风雨”来袭都不怕:轻松搞懂套期保值与套期会计的“避风港”智慧
制造业MES系统对全面预算管理真正落地有何助力?一文搞懂!
结构化思维高效发现和解决问题,管理培训笔记,无私分享
深扒BOM(Bill of Materials),物料清单:制造业利润的基石、财务BP的利器
制造业生产运营环节业财融合怎么做?10年财务BP的总结
生产型企业必看!代理出口模式退税,钱为何要“返”给你?流程、责任、利润分配一文搞清楚!
财政部会计司有关负责人就印发《关于推广应用电子凭证会计数据标准的通知》答记者问,大白话解读
易混淆的合同资产、合同成本、应收账款对比解析,一文搞懂
揭秘巴菲特接班人:从会计师到万亿帝国掌舵者,格雷格·阿贝尔的“稳赢”之路与财务人启示录
新收入准则之合同的变更,大白话拆解
收入篇第②项:对适用时段法确认收入的条件理解不正确
证监会年度例行发布《上市公司2023年年度财务报告会计监管报告》逐项解析之收入篇第①项:未恰当识别履约义务并计量收入
终于弄明白了!上市公司实施股份支付时,有关企业所得税处理的一个困惑!同时了解为何市场条件未达成的股份支付,企业账面照样确认激励成本?
价值50万的制造业经营管理报表、报告体系搭建思路,知名管理咨询公司流出
数据资产入表
个人股东在上市公司实施回购或大股东增持计划时,作为股票转让方(卖方),需要缴纳哪些税费?
大白话理解离职后福利:设定提存计划与设定受益计划
一文搞懂制造业成本核算:会计科目设置、成本流转过程、报表列报,场景化故事呈现,过目不忘!【精华】
出口增值税“免抵退”政策——“免、剔、抵、比、退”,用一个案例拆解各步骤详细计算
说人话!一文彻底吃透总部资产减值测试(理论与案例实操)
是不是可以说资产减值准备计提之后不能转回的都是非流动资产的减值准备,流动资产的减值准备都能转回?
穿越迷雾!巴菲特详解贸易战、AI、美元危机,小微企业如何“活下去、活得好”?
五问出口“免抵退”税政策——“免、剔、抵、比、退”
反向购买的背后!各方获得了什么?交易对价如何实现?
理解非同一控制下资产组商誉减值的会计处理——《企业会计准则第8号——资产减值》
Excel图表,以互补色代表负值功能
[VBA代码实现]更具通用性的取消合并单元格并自动填充原合并单元格的值
Excel取消合并单元格后,下方的空行自动填充
Google Gemini 2.5 PRO,完全免费公开!“迄今为止最智能的AI模型”!
Deepseek V3 0324 重磅更新!全面超越GPT4.5和Grok3,本地部署!
碧桂园的财报终于披露了,他遭遇了什么?还有未来吗?
灵活用工平台+个体户的把戏,还能玩的转吗?完整环节拆解,风险解读
老板80岁了,还在虚开发票,终被判刑!这个现象值得警惕
法释[2024]7号 最高人民法院关于适用《中华人民共和国公司法》时间效力的若干规定
“白条抵库”可行性?这几种情况可以申诉!
个人所得税税率表(2024版)
哪些情形下,补缴税款但不加收滞纳金?
个人所得税 APP 之变:“收入纳税明细”新增 5 个项目解析
关于“警税合成作战中心”,别被谣言带跑偏了
取缔警税合成作战中心?这怎么行?
截止去年底,个人养老金账户开户数超4900万,但空转率约7成
别被“作战中心”的名字吓着了
没有所谓避税的“妙招”
有关关联方之间借款的税务处理(全解析)
合并报表层面,母公司对间接持股子公司的持股比例计算的问题
持股70%变成持股20%,控股子公司变成仅有重大影响的关联公司,那么从投资方角度,其个别报表和合并报表层面要怎么处理呢?
7大审计程序的运用阶段及频次
中小企业财税实务必修课EP01:新公司法背景下,问注册资本是否越高越好的人还在吗?
中小企业财税实务必修课EP02:公司注销了,股东是不是就没有责任了?
中小企业财税实务必修课EP03:公司初始启动资金的来源该怎么配置?全部股东借款or全部股本金投入?
拜登退选声明原稿,逐句中英文翻译,学习英语笔记
中小企业财税实务必修课EP04:法人企业以技术投资入股的税负分析
中小企业财税实务必修课EP05:自然人个人以技术投资入股是否缴纳个人所得税?
中小企业财税实务必修课EP06:技术入股的无形资产,计提的摊销能税前扣除吗?
除了验资报告,股东还有哪些方式可以证明已全部实缴出资?
怎么看股东是否已经完全实缴?
中小企业财税实务必修课EP07:同股是否一定同权?4个容易混淆的比例
中小企业财税实务必修课EP08:哥们义气、口头约定的利益分配和公司管理机制,不靠谱!
中小企业财税实务必修课EP09:税收优惠地注册公司的空子还能不能钻?
中小企业财税实务必修课EP010:软件产品增值税超税负即征即退政策
中小企业财税实务必修课EP011:LPR利率、基点、存量贷款等相关名词的概念介绍,了解存量按揭房贷,你必须先明白的几个概念
中小企业财税实务必修课EP012:产品和服务共存如何卖?混合销售和兼营模式的不同增值税处理|为什么需要谨慎适用混合销售?
如果存量房贷利率下降,等额本金VS等额本息,哪个还款方式省的利息更多?
公司返聘退休员工需要注意哪些细节?
日常分享:惊爆!实缴注册资本也能作假,小心上当!
聊聊个人养老金涉及个人所得税的问题
普通电脑本地部署Deepseek R1人工智能大模型真实体验,联想拯救者R7000P笔记本电脑