现代分析正在迎来一个时刻。
去年之后,没有人想盲目飞行,但还有更多。从非结构化数据分析中收集到的更高级别的情报正在推动跨行业的一些令人难以置信的突破——从零售和医疗保健到物流和娱乐。这些是数据驱动的沉浸式体验,是现代消费者的赌注。以下是非结构化数据使这一创新成为可能的五种方式。
1. 量身定制的客户体验和个性化推荐
您正在浏览一个电子商务网站。当您第一次打开该页面时,该站点会通过姓名识别您,让您即时访问您的帐户和订单历史记录,并根据过去的浏览和购买行为提供您可能感兴趣的产品推荐。
零售(和其他)组织不断努力提供量身定制的体验,以建立客户满意度和忠诚度。数据正在帮助他们提高标准,以寻求更大的市场份额。假设您是一家拥有库存、订单和销售数据的零售商。您可能已经根据对这些数据的分析做出了业务决策。如果您可以将其与非结构化数据(例如社交媒体数据和网站热图)进行交叉引用,则可以了解更多信息。例如,您可以解开销售放缓的原因或确定哪些产品应该补货以及何时补货。非结构化数据还可以增强客户购物体验。人工智能和机器学习可以处理大量数据:媒体、图像、音频、传感器数据、文本数据等等。
分析非结构化数据的努力可以得到回报。ESG 的研究发现,许多组织“收集更多数据,然后利用这些数据深入了解特定的人口统计数据并制作专门的产品。因此,客户看到的产品更能吸引他们,改善他们的生活方式,和/或解决以前未满足的特定需求或愿望。” 该研究还揭示了以下有关分析成熟组织的信息:
- 71% 的受访者表示客户满意度得分高于竞争对手。
- 他们超过客户保留目标的可能性是其 3.3 倍。
2. 通过空中损害评估和分析提高人身安全
当自然灾害来袭时,即使只是评估损失也可能是一项困难、耗时且危险的任务。Smart Digital Sales & Holding GmbH (SD)率先使用无人机来促进安全和快速恢复。通过结合无人机、高分辨率相机和人工智能,SD 可以快速扫描影响许多行业的问题,从农业和基础设施到公共安全等等。这需要大数据和非结构化数据(例如图像和视频)的分析,为组织的客户提供全新的视角。
当 SD 无人机飞越难以进入或危险的农田或灾难现场时(例如,在发生雪崩、洪水、森林火灾或电力线损坏之后)时,它大约需要一个小时来捕捉条件图像以下。凭借最先进的测量设备、激光系统以及光谱和热像仪,该无人机以极高的分辨率捕获图像——每秒大约 50MB 的数据,每次飞行总共 180GB。这意味着每年,SD 无人机都会捕获近 1PB 的数据。
捕获和存储数据是一回事,但分析才是真正神奇的地方。该团队将图像输入到复杂的人工智能算法中,这些算法可以识别模式并进行预测。SD 的整个业务取决于以卓越的精度和速度管理和移动大量非结构化数据。
结果:政府机构能够更快地评估自然灾害的规模和风险,并更快地发布公共警告,这可能是挽救生命的关键。公用事业公司可以进行更主动的维护,以避免停机和停电。农民甚至可以利用这些见解来提高生产力、灌溉和收获。
这只是一个例子,说明模糊人与机器之间的界限可以帮助创造一个更安全的世界。
- 医疗影像和诊断加速治疗和创新
一些非结构化数据最早起源于医学研究,因此该行业是将数据转化为洞察力的最大机会之一也就不足为奇了。当您与人类和医疗保健打交道时,数据将非常多样化和复杂:约会记录、实验室诊断、电子邮件、行政记录、医学影像文件、测试结果等等。快速访问和分析这些数据可以帮助提供者更快地工作并深入挖掘以治疗患者。
成像是这里最吸引人的用例之一。例如,PAIGE.AI 是一种企业成像解决方案,通过以成千上万张组织样本图像的形式向其提供非结构化数据,教会其 AI 模型识别癌细胞。有了足够的数据,该系统可以帮助病理学家避免误诊并改善治疗。这种数据密集型培训以速度和规模利用 PB 级临床数据,推动了公司将病理学转变为更严格的定量学科的使命。2020 年医疗保健领导力调查中的人工智能也强调了这一点,发现“放射学正在开辟人工智能之路。迄今为止,用于成像的 AI 应用程序数量超过 FDA 批准的所有其他类别的应用程序,”正在被用来增强对乳房、胸部和心血管成像的分析。
- 预测和实时分析以改善服务
将非结构化数据与先进的预测和分析技术相结合,结果可能令人难以置信。事实上,每天都有新的用例说明预测分析改变日常生活各个方面的可能性。
以印度的德里地铁铁路系统为例,该系统以没有固定的列车时刻表而著称。相反,在它的地铁站,游客可以在时刻表信息中找到下一班火车到达的分钟数。地铁系统运行高效,在封锁前每天运送近500 万乘客。乘客使用支持 NFC 的卡或令牌进出系统,这些卡或令牌受到实时监控。由于该系统拥有可追溯到 15 年前的乘客数据,因此它能够根据日期、星期几、公共假期、天气和其他重要事件等参数估计任何给定日期的预期乘客人数。
通过将历史数据的估计值与实时客流数据相结合,可以动态调度列车以适应交通,确保资源的有效利用(以及乘客的舒适度)。
- 使工厂自动化的传感器数据
自动化是工业 4.0 的关键驱动因素,已经带来了许多进步。例如,视觉检查机器人可以在工厂执行监督工作。
空间数据驱动这些机器人的活动。机器人——其中一些是协作机器人或“协作机器人”——根据来自摄像头和红外传感器的非结构化数据进行实时检查。他们还可以使用数据来决定是否接受或拒绝成品。
此外,他们的检查数据可用于分析和改进整个工厂的生产和自动化工作。这导致了所谓的“黑暗工厂”的兴起,它们在整个生产过程中不需要任何人为干预。分析大量非结构化数据的能力使这一成就成为可能。
我们还能从现代数据中学到什么?
每条数据都有潜力——但必须正确利用它并结合正确的技术才能变得有价值。
这完全是关于非结构化数据可以提供的洞察力层——但这些层并不总是一致的。为了有效地分析它,它必须被整合和快速。这就是合适的 IT 基础设施和存储的用武之地。根据摩尔定律,处理速度正在提高。并且高性能要求是一致的,即使在高度多样化的数据配置文件中也是如此——这是许多传统存储解决方案无法应对的挑战。