当前位置: 首页 > news >正文

结构化数据、半结构化数据、非结构化数据

​1.结构化数据

结构化数据指的是具有明确的、预定义的数据模型,遵循一致顺序的数据。最为常见的结构化数据是关系型数据库中的数据。

结构化数据有三大特征,同时满足这三个特征的,可以称之为结构化数据。
(1)有明确的含义(2)有严格、一致的顺序 (3)有明确的数据类型

​2.非结构化数据

非结构化数据指的是没有预定义的数据模型,数据结构不规则或者不完整的数据。最为常见的非结构化数据是文档、图片、视频等。

​3.半结构化数据

半结构化数据是指介于结构化数据和非结构化数据之间,具有一定的结构化特征,但不完全符合结构化特征的数据。
最为常见的半结构化数据包括日志文件、XML 文档、JSON 文档、Email、HTML文档等。

(1)数据结构带有自描述性;
数据中包含了对数据结构的描述信息,例如数据含义、数据类型等信息;

(2)结构与数据往往融合在一起;
在数据中既有描述结构的数据,又含有实际的数据,体现出结构与数据紧耦合的特征。

结构化数据可以通过固有键值获取相应信息,且数据的格式固定,如RDBMS data半结构化数据可以通过灵活的键值调整获取相应信息,且数据的格式不固定,如json,同一键值下存储的信息可能是数值型的,可能是文本型的,也可能是字典或者列表非结构化数据不可以通过键值获取相应信息。

在信息社会,信息可以划分为两大类:

信息能够用数据或统一的结构加以表示,称之为结构化数据;
信息无法用数字或统一的结构表示,称之为非结构化数据。

结构化、半结构化、非结构化其实是按照数据格式分类。结构化数据属于非结构化数据,是非结构化数据的特例。结构化与半结构化数据都是有基本固定结构模式的数据半结构与非结构化数据与目前流行的大数据之间只是有领域重叠的关系,本质讲两者并无必然联系。业界有将大数据认为半结构/非结构化数据,是因为大数据技术最初是在半结构化数据领域发挥作用,其本质是将数据处理技术与数据格式混淆,是不正确的。


http://www.mrgr.cn/news/16935.html

相关文章:

  • 30Kg载重1小时长续航油电混动无人机技术详解
  • 部署project_exam_system项目——及容器的编排
  • 客户端、APP、Desktop和H5的区别
  • 【深度遍历】【排列组合】【力扣】有重复字符串的排列组合
  • 智慧警用装备管理系统|支持国产化
  • 博客园-awescnb插件-geek皮肤优化-目录优化
  • 网络编程学习:TCP/IP协议
  • 苍穹外卖项目前端DAY01
  • 域渗透应急响应
  • 苹果mac数据恢复概率大吗 mac数据恢复专业软件哪个好用
  • Python | Leetcode Python题解之第388题文件的最长绝对路径
  • C++笔记---模板初阶
  • Linux系统性能调优全面指南
  • 力扣3272.统计好整数的数目
  • excel透视图、看板案例(超详细)
  • AJAX day-02 HTTP格式JSON格式
  • 如何删除浏览器每次登录自动保存的密码,以防自动登录泄露自己的隐私
  • 中仕公考:公务员公示期一过就能入职了吗?
  • Redis个人总结
  • UDP数据报套接字编程