合成数据不是逃避数据质量危机的“逃生路线”
快速阅读: 《研究杂志》消息,市场调查协会指出合成数据不应成为廉价劣质数据的代名词,高质量合成数据依赖优质一手数据且成本高昂。洞察力协会呼吁全行业提升数据质量标准,解决买家对数据信心不足的问题。多位专家强调需持续投资与合作,共同应对数据质量挑战。
在解决数据质量危机并增强对研究信任的会议环节中,市场调查协会(MRS)常务董事黛布拉·哈丁表示,合成数据不应被视为以低价加剧市场调查行业现有数据质量问题的机会。“任何优质的合成数据都基于出色的一手数据——这是一个需要持续投入的模型。”哈丁说,“如果做得好,合成数据其实非常昂贵。”
“将合成数据和人工智能视为摆脱数据质量问题的潜在出路是非常危险的,因为这不是一条出路。如果我们推动数据质量问题并急于采用廉价的合成数据,就会制造出新的问题。”
“我们有一种习惯,有了问题就创造解决方案,然后这个解决方案又变成了新问题。很多时候这是因为价格竞争过于激烈。”哈丁还表示,样本采购生态系统需要简化,以帮助应对数据质量危机。“我们已经创建了最复杂的样本采购生态系统。你看看它,会想‘没有人会从这一点开始’。”她解释道。
“没有快速解决办法——也没有缓慢解决办法。这将是一个我们永远要面对的问题。人工智能和合成数据让这个问题更加复杂。重要的是,我们需要投资工具并进行对话,以便我们能随着挑战的演变而不断进步,从而持续解决数据质量问题,避免撞上天花板。”
在同一小组讨论中,洞察力协会首席执行官梅勒妮·考普赖特表示,行业需要共同努力提高数据质量标准。“要解决这么大的问题,需要所有人参与。”她说,“我们遇到了一些困难,无法让某些群体加入对话。我们需要在未来六个月内解决这个问题——我们需要弄清楚如何让买家和品牌足够重视,将其纳入采购流程。”
考普赖特补充说,虽然这个行业是“测量的专业领域”,但历史上并未衡量客户信心和实际质量指标。她提到已推出一个买家情绪评分,显示三分之一的买家对其收到的数据缺乏信心。考普赖特还补充说,美国推出了八大数据质量基准,并计划于6月在全球范围内推广。目前基于30家供应商提供的120万条记录数据显示,平均有40%的数据被从项目中移除。
“我们会没事的。但危机在于缺乏信心,这种信心可能会改变客户行为。”考普赖特总结道。
汇丰集团洞察经理塞巴斯蒂安·米契森告诉小组成员,行业“应该能够解决这个问题”,并补充说:“归根结底,这是一个关于测量某事物并找到相对点的问题。谁能比一群研究人员更好地解决这个问题呢?”
作为买家,米契森表示,品牌内部的洞察团队需要信息来证明改善数据质量“值得额外支出”,并补充说:“这是一个行业问题。显然,我会从终端供应商开始,但作为客户,我认为我们显然也有角色可扮演。”
尼基基地质量与安全总监乔安娜·拜格雷夫表示,尽管正在进行大量积极的工作,但欺诈行为仍会存在。“数据质量将持续发展——我们需要在这个领域持续努力。”她说,“但实际上很多事情正在发生,只是还不够一致,也不够显眼。我们需要做更多工作,确保我们始终领先一步。”
(以上内容均由Ai生成)