对话谷雨数据编辑郝昊：有腔调的数据新闻作品如何诞生？

首页 > 关于我们 > 新闻信息

返回列表

2024-11-06

分享至

对话谷雨数据编辑郝昊：有腔调的数据新闻作品如何诞生？

　　如果读者去看视频或者听音频★◆■■◆，花费的时间会更多。从报道形式上来看★■■◆■■，我认为图文形式呈现的数据新闻■★◆★★■，是当前最好的方式。虽然我们在努力简化图表，但它传递的信息还是需要读者认真阅读的，不太适合用视频的形式去呈现，视频中可能需要预留3-5秒的适应时间。从这一点上来说，读者对图文类数据新闻的需求还是有必要的■◆。

　　A■◆★■◆★：这是要分情况的。在个体故事方面，很大一部分情况是撰稿人去跟当事人聊了一下。因为有一些选题，比较需要这类故事的补充◆■◆★，这种操作方式，就是以跟当事人沟通过的表达方式进行呈现。还有一些是我们对于已经被报道或者社交媒体上看到的当事人的故事有一些不确定的点★★■◆★■，这种也会去确认一下◆◆，想了解一下当时说这句话动机或者有没其他考虑。还有一些情况就是当事人的表述很直白◆■★★◆，也不太容易被误解，这种我们一般倾向于直接去进行真实的呈现。

　　还有生活方式类◆★★，我们会关注当下年轻人中间有哪些兴起的生活方式，比如去年我们曾关注年轻人更多去逛商场，而不是去商场消费的现象。

　　一般来说，我们肯定希望在标题上能给出一个强结论。但有时稿子里的结论特别多★■◆★■◆，很难提炼出来一条特别核心的结论，或者核心结论需要考虑背景条件◆■★、加很多的限定词。在这种情况下，为了保证标题的准确性，就无法以强结论作为标题，采用的标题可能是偏“问句类型”的◆◆。

　　第二◆◆■■◆，要判断二手数据所使用的研究方法。举例来说，医药方面的文献综述类文献★★◆◆★，会整合多篇论文，来得出某些研究结论。我们不倾向于使用这类数据，还是希望看到一手的■★◆、新鲜的调查类数据。

　　以为例，文章指出：很多得了抑郁症的中老年女性会走失★■★■，这在当时是一个很新鲜的角度■◆■◆★■。抑郁症对患者生活的各方面都会产生消极的影响，但是文章细化到了“走失★◆”这个角度上，通过数据分析把走失和抑郁症关联起来。中老年抑郁症女性“走失”的情况比较多■◆■■◆，这个点是很戳人的◆★■■★■，这个报道角度是足够吸引人的■◆★。

　　第三◆★★★，要关注概念的维度。在某一研究领域，一些专业概念表面看起来是一样的，但实际上，不同文献对其维度的定义是不同的。这就要求我们去吃透文献，在稿件中尽量使用同一概念的维度，拉齐定义的标准。如果无法对齐的话，我们会在图表下面做一些备注，让读者知晓概念的差异。

　　第二点是时代性，选题要符合当下的语境◆★★◆。我们不希望当下的选题是三年前也可以做的◆◆■■，我们希望它是当下年轻人关心的话题。

　　Q：谷雨数据的文章里会引用很多个人故事★◆◆◆，这些故事可能来自社交媒体，在写稿时需要征得当事人的授权吗？

　　其次，撰稿人还要去判断文本内容和选题的关联。有时，撰稿人费了很大力气去爬了很多文本◆■◆★，但最后发现结论与选题没有关系或结论不能提供增量。撰稿人还要关注文本是否具备多样性。我们做过一个的选题，要去归类大家为了克服失眠做了哪些努力，我们发现它的答案非常丰富，有人失眠后听音乐■■★■★★，有人数羊，有人喝酒……这种题就挺适合爬取文本类的数据，因为它的数据是多样的◆■★★◆。但有些问题的答案是同质化的，不适合去爬取，因为词频重复性过高，可能不用分析都能看出来结论了。最后，在数据处理方面，我们会关注词性，经常需要处理掉虚词，优先筛选出形容词、名词■★◆◆■。

　　科学新闻，不仅关注最新的科学研究成果■★，还试图解释科学发展过程中的文化■■◆★★、政治与伦理意涵。天文地理、科技环保■■■◆、生物医药■★★■★◆.■◆◆...★■■★◆..都是科学新闻记者们追踪的领域■◆，他们是连接科学界与公众的桥梁，也是理解■★◆◆■、阐释与传播专业学科知识的赶路人。

　　此外，有时读者直接通过呈现的图表，会很难直接提炼出相关的结论■★★，因为撰稿人做了两层的分析，这种情况下我们会建议撰稿人将第一层的初步结论也写出来★◆◆◆，再写第二层的分析结论。对于一些比较特殊的筛选方法或特殊的定义，我们会在备注中说明★■■◆★◆。

　　A：考虑到现在的就业环境，提建议比较困难◆◆★。对于特别想从事这个行业◆◆★★◆，哪怕不做全职，是想做兼职作者的学生，我建议尽量有一些自己独立完成的作品■◆◆★◆■，尽可能地让自己的能力完备一些。哪怕你没有办法独立作图，但是数据收集、分析◆★■◆■、撰稿这些步骤，还是要独立完成的■■■■★◆。

　　第三点是信息增量，我们希望给读者提供尽可能多的信息增量■★◆★。这里需要强调的是■◆★，我们要求的增量是指通过数据挖掘◆◆、数据分析和数据可视化来呈现的，如果说我们判断选题的增量是需要采访一些特定的人物才能实现的话，我们会认为该选题不适合谷雨数据来操作。

　　A：首先要判断选题角度是否有增量。一篇有增量的报道，其核心信息是没有被其他媒体充分报道过的。对于增量，还可以有更理想化的设定，当某类选题已经操作很多次了◆★■★■，但是你拿出了一个新的选题角度：把两个事物关联起来的同时又通过数据分析证明关联是成立的。这是超出预期的信息，是很好的增量◆■◆■★。

　　A◆■■★◆：选题的类型其实很多样的★◆◆◆，其中有几类是我们操作相对于比较集中的◆◆■■■。第一类是教育类选题■★，我们关注学生的学业情况和就业情况。谷雨数据每年都会根据毕业生质量报告输出选题◆■★，总结最新的毕业生就业趋势。

　　还有一种常见的逻辑问题，就是撰稿人没有考虑读者对于话题的认知情况，想当然地认为读者的认知和TA自己是一样的。因为撰稿人做了很多案头工作，TA对这个话题已经深入了解了，在写文章时就可能会忽视◆★◆★◆：很多读者可能对这个话题的理解是极其有限的。如果撰稿人在呈现话题时◆◆◆★■，做不到深入浅出地表达，读者就会觉得难以理解，这种情况多出现在医药类选题上。

　　我们更希望呈现出结论的分析过程，即告诉读者★◆■◆◆★，通过某个图表能够提炼出什么样的结论。

　　最后，结合谷雨数据做稿的特点，我们会去寻找稿件的第二落点。第一落点是指和新闻事件直接相关的操作方向，在人力资源和操作周期方面，操作第一落点对我们来说有些困难。因此我们会把更多精力放在第二落点上，去考虑从单一的事件中还可以延展出哪些更丰富的报道思路◆◆■。

　　A■★★：很难说遇到了什么具体的问题，只能说一直存在局限。而且这个局限对所有做数据新闻的媒体来说都一样。

　　其次，是图表的主体部分，第一，图表的呈现需要清晰，核心结论需要能被读者一眼看出来，否则就需要在核心结论上做一些强化的处理。

　　为了获得更多一手数据，我们现在增加了许多文本类的分析★◆■■■★。我们经常去看豆瓣小组或小红书★★◆★，这里面就有大量的语料，针对这些语料做一些分析◆★★■，这是增加一手数据来源的渠道之一★★★。第二种方法是设计调查问卷去获得一些偏态度类◆★■、状态类的数据。这种方式耗费人力及成本就更多。

　　A■■：谷雨数据局对文案的基础的要求是表达准确和严谨■★。对于文风有趣好玩的撰稿人◆★★■◆◆，我们也还是希望趣味是建立在准确的基础上■■■。在准确和严谨之上，就是有趣好玩，并且要丰富。有时我们去评价一篇文章，会觉得特别干，里面全是数据结论★■，没有任何的补充性分析或案例，这种文体读起来就非常枯燥。通过与当下热点关联度高的开头、流畅的过渡■◆★◆、合适且吸引人的案例、有深意的结尾（可能是提炼话题内容■★★，或是升华主题），这些都可以提高文案的丰富性。更高层级的要求★◆◆◆■，就可能希望文案是有风格的。比如有些撰稿人的文案会有黑色幽默的风格★★，带着一些小梗，具有个人特色，这种我们也很鼓励。

　　腾讯新闻客户端（上）与微信公众号（下）标题对比（图片来源■■◆：腾讯新闻客户端和谷雨数据微信公众号）

　　谷雨数据可视化图表的组成元素包括标题★■、主体、注释等（图片来源：谷雨数据）

　　有一些偏疾病类议题，在语言表达上也需要慎重。有一些语言会位于患者的“雷区”，这类患者可能不希望这么去被称呼。在这篇稿子中，我们了解到相关的患者会比较非常在意疾病相关的语言◆★◆■，于是对文章做了一些■■■★“去病化”处理，比如不要提“患者”◆★■★，而是说■■■★“ADHD人士■★■★★”；★◆◆■■“症状■◆■◆■”我们也用“表现■★★”来替代。

　　A：我们面临的压力是没有变的，还是面临着短视频（现在可能还有短剧）和算法的冲击。在措施上，我们能做的有限■■★■■，基本操作是根据不同的平台的算法逻辑去做差异化运营，对文章做出一些微小的调整来适应平台逻辑。

　　A：医药类最基本的信息来源就是相关的疾病指南。有一些特殊疾病可能是国外的发布的医疗治疗指南■■◆◆、临床指南★★★■■◆，有一些比较常见的疾病的话，我们国家也会发布相应的一些指南◆★■★，有些会称为“共识”（如关于ADHD有《中国成人注意缺陷多动障碍诊断和治疗专家共识》）。这些一般是业内人士较为认可的，其中会提到一些参考来源，一般都是比较可靠。还有一个方式也适合不太了解相关议题的作者去参考■◆■，就是去看医药健康类的自媒体。可以了解它们引用了哪些期刊，顺着这个期刊也能去挖掘到一些相关的文献。

　　第二■◆，图表应尽量避免给读者造成一些别的联想或者会出现误读的情况★■★★◆。在同一个图中■■★◆★，如果不同坐标轴表示的含义不同，就容易出现这种情况◆◆★★■■。一般需要对坐标轴表达的含义做更清晰的呈现。

　　A★◆■◆：这篇文章本身的内容不错，自身的流量也还可以，我们也获得了微信公众号的平台推荐，促成了这篇“爆款”。这两年■★■■★◆，读者会比较关注“就业”话题，文章中呈现出了一个被热议的◆■★■“真问题”★■■◆：很多人真的在考虑失业后或未来失业后★■★★◆，要不要去开网约车？还能不能去开网约车？对于这些人而言，这就是一个很有信息量的文章。在报道中，我们也把网约车目前面临的“僧多肉少”的情况，非常夯实地呈现出来了■★★★■。现在微信公众号也喜欢推荐一些和热点事件相关的稿件，我们在选题时，也会尽量考虑平台的偏好，希望获得更多平台的推荐■■★★。

　　此外★■◆★★，以图文为主的平台也在做出改变◆★■◆★◆，给深度内容更多曝光机会。在微信公众号■■◆■★，读者阅读文章后，底部也会出现相关文章的推荐，来增加对图文内容的曝光。

　　郝昊希望谷雨数据能够做出“引发读者共鸣■■★◆■，有腔调的作品”，而这样的作品包含这些要素：小切口的选题、有增量的内容、读者一眼可以看出结论的可视化和有逻辑的稿件结构。

　　A■◆：第一点是公共性，我们会判断选题是否被大多数人关注★■◆，尤其是我们的目标用户是否关心■◆★◆■◆。我们根据公众号后台的数据和互动发现★◆◆■◆，谷雨数据的目标用户应该是一些年轻的高知用户■■★。

　　做选题时，还要考虑到数据空间的大小■★■■。很多选题满足以上要求★◆◆■，但它的数据空间很有限◆■■，我们不得不放弃。同时，我们希望稿件能够有一些原始数据，但无法强求。如果在数据空间有限的情况下还要求要有一手数据的话，很多选题就没办法操作了。只能说，一手数据是我们理想的数据来源。如果实在不行◆■，那只能用一些来源严谨、能够被二次考证的二手数据◆■★■◆◆。

　　如果数据的维度确实特别复杂，我们会倾向于割舍一些维度。有些数据源针对一个维度就有四五个参数，如果真的放不下的话，我们可能会舍弃一两个，或者把它拆开◆◆★◆★■。虽然说有时会增加篇幅■◆，或者看起来没有那么精炼，但是至少这样表达的核心信息点是非常清晰的。

　　最后是备注，以及数据范围的说明，这也是编辑最常给图表提建议的地方。我们希望在每一张图表中，传递的信息是足够的◆■■◆◆，避免出现图表被单张传播时，信息被误读的情况■◆★◆★。有些图表会存在数据范围写得不全、时间没有标注★◆◆、维度定义不明的情况。在调查问卷类的数据中，不同体量的数据，其代表性也是不同的■◆★◆■。一些涉及到地区相关的备注，要关注是否包括港澳台地区。

　　谷雨数据制作的关于■◆◆“中老年女性抑郁症与走失”的可视化图片（图片来源：谷雨数据）

　　总体来说，对于科学类的选题，我们做起来会非常谨慎。其实关于某种疾病的数据和信息■★◆■，比如患病数据、治疗方案等，是很容易获取的■◆，数据空间一般都比较大。但是难度还在于要不要做这个题、这个选题主要是做给谁看的、其中挖掘的增量是否具有公共性◆◆◆◆。当我们判断这个疾病确实进入了大众的视野中★◆■◆■，大家对此确实更加关心了★★◆■★，我们才会去操作这个选题。

　　另外，在小宇宙播客的show notes（指对播客内容的图文介绍或纯文字介绍★★★，往往附带播客的时间线索指引）里★★■，会提供很多与播客内容有关的信息。财经类播客的show notes里会给出大量的数据■◆◆★★、图表和背景信息，因为这类信息很难通过声音去传递。我认为数据内容的范围比较广◆■★，哪怕是含有数据的show notes，其实它也是在解释数据来源和数据背后的洞察■★◆★◆。所以说，数据新闻擅长把一件事情的来龙去脉讲清楚，它可以整合事件的背景，也可以描述事件的发展趋势★■★。数据新闻可以帮助读者快速形成对某个领域的概览■◆◆，信息效率很高◆■◆。

　　图表中的单位容易被遗漏★■◆◆■，编辑要核查单位是否准确◆■◆◆★，因为在不同的单位下，数据代表的意义是完全不一样的。

　　深度训练营发起了“科学报道”系列，我们与科学新闻从业者对话，试图了解他们与科学界互动的过程。面对艰深的科学知识■■■，如何做好案头准备■■？面对争议性研究，如何突破事实核查的困境？如何降低科学报道的◆■■“门槛■★■”◆■，让其更好地服务公众？深度训练营邀请充满好奇心的你，一起探索让“赛先生”发声的方法论。

　　Q：在谷雨数据的作品中，您最满意的是哪篇■★？您认为理想中的数据作品应该包含哪些特点★■？

　　Q■■★■■：如何判断撰稿人选取的数据的代表性和准确性★■■★？如何判断数据结论的可信度◆◆■★★★？

　　对于深度内容消费，相比2021年，我的想法比之前乐观一些■◆★★◆◆。虽然短视频依然很火，算法推荐依旧是主流，但我也发现其实依然有很多人或者说越来越多人愿意在深度内容上花费时间■■◆。比如播客的流行，播客的时长动辄在一个小时以上，但越来越多人会尝试去听播客获取信息。播客的内容越来越丰富，也有很多商业化成功的案例，这说明大家对于深度内容还是有需求的。

　　Q：在文章的结构上★◆■，我们发现数据新闻的常见结构是“描述现象/概念——解释成因——尝试提供方案”◆◆★★，您认同吗■★■？

　　在选题操作层面上，我们希望选题是从很小的切口去展开的。一般来说，我们非常不想让撰稿人去做特别宏大叙事的选题，这种选题可能需要一本书去实现◆★。所以我们希望找一些小而有趣的切口。

　　Q：您曾在中提到过◆■★■，数据新闻面临着短视频和推荐算法的双重压力，推荐算法对图文形式的新闻并不友好，谷雨数据采取过哪些行动去面对这些压力★◆◆★★？

　　第二类是与钱相关的选题，包括就业、理财投资、行业发展等◆■◆◆，是我们这两年讨论很多的领域■■★★◆◆。

　　在还没有成为谷雨数据-腾讯新闻（以下简称谷雨数据）编辑之前★■■◆★，郝昊是一个对编程、数据分析都很感兴趣的文科生。在国际新闻的研究生课堂上，■◆■◆■“数据新闻”这一跨学科的领域引发了她的兴趣。2015年，她前往美国攻读第二研究生学位，正式开启了数据新闻的旅程★◆。2017年◆■，刚毕业的她来到腾讯新闻做信息长图和含有可视化与采访内容的融合报道。

　　第一，数据空间是有限的。很多想做的选题可能没有办法找到丰富的数据。这和数据开放度有关系，这种局限是一直存在的◆★。第二个是用户接受度的问题★◆■◆◆★，我们一直以来都在努力降低图表和文章内容的理解门槛。虽然现在知识普及较广，教育水平也更高，大家对数据新闻的接受度也有所提高，但相较于其他形式来说，用户对数据新闻这种形式的接受度比单纯的图文报道或者讲述人物故事的稿件低。

　　除此之外，编辑也会关注定期发布的数据★◆◆■◆，比如结婚率■◆★★、离婚率、毕业生就业质量报告等◆★◆★◆，在数据发布之前★◆■★，我们就会为了相关的选题做一些准备，去留意数据的变化■◆。

　　原标题：《对话谷雨数据编辑郝昊：有腔调的数据新闻作品如何诞生？科学新闻》

　　深度训练营对话郝昊■■◆★，从数据新闻的制作过程入手★■■，复盘各个操作环节的方法论、数据新闻中科学类选题的注意事项以及对当前深度内容消费的最新观察。

　　A：我觉得一般的选题其实基本就这三块◆■★。只不过我们对于解决方法部分■◆■★，一般来说不会太作为重点去呈现。从受众的角度考虑，很多公共议题的解法不是普通人能实现的■★◆★■，它可能需要政府■◆★、相关组织机构去推动。所以与普通人关系不大的内容我们会弱化★◆■◆★■。当我们判断这个解决问题的方法和普通人关系非常大，并且普通人可以去实现★◆■，我们会把解法单独陈列出来，比如在中，我们给出了改善脂肪肝的建设性建议。

　　A■◆◆■：实际操作中大多数还是边操作边调整核心结论。在收集数据之后，发现数据无法支持预设的结论是比较常见的情况。因为一开始看到的选题线索可能缺少前因后果和背景信息，所以对预设的内容有一些错误的或不完整的判断都是正常的。

　　本文为澎湃号作者或机构在澎湃新闻上传并发布■◆，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

　　在微信公众号之外◆■◆，我们还在腾讯新闻客户端和微博去发布稿件◆■◆◆。腾讯新闻客户端是一个资讯平台。因此对于一些长文章■★★，我们会先做一些内容的精简★■◆■★★。在标题上，为适应资讯类平台的调性，我们会调整标题使其更资讯化。

　　首先是标题。一些文献本身就有标题，撰稿人需要做的就是把较为学术性的表达翻译成适合普通人阅读的标题■■★◆★★。但也有一些标题，是撰稿人在数据分析后提炼出来的结论■★★◆■，这时编辑需要核对标题的准确性。

　　A：在日常的核对上★◆◆★，对于文献类的数据★★◆◆■，编辑会阅读原文献，判断撰稿人的提炼是否准确■◆■★★■。对于一些原始数据◆★■，我们也会做一些处理◆◆★■★■，看结论和撰稿人的结论是否一致■★★◆■。对于同样的数据范围和数据来源，选题内部的单条结论如果被其他媒体报道过，我们也会去对比一下是否有差异◆■■◆★。

　　A：在框架阶段★★，我们会关注稿件的核心数据与核心内容。在这一阶段◆◆◆★★■，我们看重稿件是否能给读者带来“增量★★■★■■”◆◆★★■。如果选题没有办法给读者提供足够的信息增量★■◆，哪怕选题有足够的热度，或者选题的时效性非常强★★◆■★，我们也不会去操作■◆★◆★★。

　　我喜欢这篇足以当作范本的作品，所以我理想中的数据作品应该包含“操作扎实、有小切口◆◆◆◆、有内容增量和文案写得好”这几个特点。

　　A：关于数据空间的问题★★◆，我们常规数据获取来源是由政府或相关机构发布的公开数据★◆■■★，理论上来说这是我们最主要的数据来源，但当下数据空间是有限的。

　　Q★◆■★：您曾提到过，谷雨数据制作过很专业复杂的图表■★◆，但读者可能存在理解上的困难，如何让图表既简单又能很准确地传递信息呢？

　　A：我们要呈现的分析过程◆◆■★，不是指收集数据、选用合适的方法进行分析、得出结论的数据分析过程，这更多是偏操作层面的内容，与主题的关系并不大。

　　Q：谷雨数据2023年发布的稿件◆■★◆，浏览量达到10万以上，成为了“爆款★◆◆★★”。这与微信公众号推荐相关么◆★？

　　我们之前做过的★■，是关于专业变化的稿子，主要的数据来源就是撤销以及新增的一些专业◆★◆，这篇稿子的主体部分就是在描述现象，因为这个变迁很复杂，不同的时间★◆★★、不同的专业◆■，又有撤销和新增★■◆★★，维度是非常丰富的。专业还有对应的科目和大类，可分析的点非常多★◆★■，这一篇就主要就是分析现象，但最后呈现出来的信息增量也是足够的。

　　A：首先在作者的筛选上我们就会比较谨慎◆◆，一般倾向于找有相关背景★★★◆★、做过相关议题比较多的作者，因为他们积累了一些基础的认知★★◆◆，经验比较丰富■★★。对于一些比较复杂的议题，我们也会去找有专业背景的人帮我们去审稿■◆，比如像这篇稿子■★★，我们去找了相关领域的专家青衫（专注ASD/ADHD的自媒体「青衫Aspie」创始人◆◆■、美国加州大学神经科学博士、精神病学系博士后)去审稿◆■★■■，寻求一些建议。还有就是上文提到的，要做到深入浅出地表达观点，方便读者理解。

　　关于阅读门槛的问题◆◆■★◆◆，从操作层面上来说，我们主要做了几方面的努力。第一■■◆■★★，我们希望作品能够引发共情共鸣，尽量是有些腔调的★★◆★。而对于一些有话题性的选题，我们希望它是有梗的，好玩的。我们希望能够更专业化地处理文案，让大家更好地理解我们分析出来的数据内容。这是我们做的比较大的尝试★◆◆◆。

　　A：结构上可能会出现几个比较常见的错误。一种是撰稿人把针对这个话题的全部内容放在一篇稿子里◆◆★，稿子特别冗长，结构混乱，重点不突出■★■■★。其实，撰稿人可以把稿件中有信息增量的部分单独提炼出来，以一个更小的切口去呈现出来。

　　第二是我们很早地确定了数据图表的风格◆■★★◆◆，不同类别的内容都有建议的图表方式。我们希望能够做出读者一眼就能看出核心结论的可视化，所以在数据可视化的选择方面，我们倾向于去选择常见的、易懂的、重点突出的呈现方式■★。

　　A：文本类的数据在我们的选题中是非常常见的，借助文本类数据◆◆，我们可以了解到用户对某一话题或者事件的态度和观点。我们希望做与大多数人生活息息相关的选题，因此我们很想去了解普通人如何看待某个议题。

　　A：首先我们要找靠谱的数据发布方，对于学术文献，我们尽量去看权威的核心期刊，尤其是对于医药类和科学类的报道，我们会更谨慎地筛选文献。其次，我们要判断数据是如何得来的。一些商业机构的数据◆★◆★★■，它们的样本量可能没有做精心的筛选和设计◆★◆■★，可能存在一些纰漏，那它们得出来的结论也是存疑的◆■■。

　　其实，很多时候当我们梳理出问题背后的原因时■■，它的解决方法就已经呼之欲出了★◆◆■■。所以我们不太会去单独呈现解决问题的方法◆★★◆。

　　通过数据去找选题的任务，在谷雨数据往往由编辑来实现■◆■，因为编辑的日常工作就是阅读各种各样的新闻报道★■，留意报道中的新鲜数据和数据结论■★★◆◆■，再去思考这个结论能不能延展出一篇文章。

　　我们在做一些大的策划时★◆，才会使用调查问卷类的数据■■■★，其他情况下用得比较少◆◆◆■■★，因为它的周期长且很耗费人力。2022年三八妇女节的策划是通过问卷调查来收集数据的，在寻找选题时，我们考虑了很多因素，首先要选择有报道价值的女性议题，其次选题的数据要适合用问卷来收集，最后该选题还应该是我们擅长操作的◆■■◆■■、读者感兴趣的■◆。经过多轮的讨论后★◆★◆◆，我们确定了要做关于的选题，在这之后，还要设计问卷的维度◆◆★◆■★、规划分发的方式。我个人非常喜欢做调查问卷，但真很耗费精力，每次做完问卷◆■，我们团队可能都要扒几层皮，但我们也非常珍惜操作调查问卷的机会。

　　对于数据结论◆◆★★，我们会关注基于某个图表能否提炼出某个结论。还有一种情况是◆★■■，撰稿人对图表做了加工，仅看图表的话，无法直接提炼出结论。我们会去询问撰稿人的处理方式，建议他在文案中呈现提炼的过程和思维链路◆★★◆■，方便读者更好地理解。

　　其次◆■■★◆，可以根据合适的时间节点去选择报道角度。上文提到的报道角度也和当时火热的“苏敏现象”相关。（苏敏是“50岁阿姨自驾游★★■★”的账号作者，她曾患抑郁症。在苏敏58岁的那一年■■，她“逃离家庭◆★★”，开启了自驾旅行。）我们发现这一现象的背后与老年人的精神困境有关★■★◆，所以想到了抑郁症，而且做该选题时，也临近精神卫生日这一时间节点■★。

　　A：我觉得这个要求对于撰稿人来说挺难的，一些成熟的撰稿人可能也不具备这个能力■◆■◆◆★。换句话说，撰稿人发现选题的能力和精力都是有限的。他们有自己的本职工作，也没有必要去每天阅读大量新闻资讯来寻找选题◆★。

　　A：上文提到的关于◆★★◆■■“中老年抑郁症患者”那篇就是个很好的例子。首先■★◆，这个选题切口小，并具有一定的稀缺性★■■■★。中老年女性是抑郁症高发的群体，但社会对它的关注比较少★◆■。

　　第三类是健康相关的选题★◆★■★，我们操作过与疾病相关的选题◆◆◆，或者是偏生活方式的选题◆★■★，有些选题并没有探讨某个疾病，但是与读者的健康相关。

　　A：标题的特点是和主要分发平台有关的。谷雨数据的文章除了公号外，主要的分发渠道是腾讯新闻客户端，在客户端中◆■★，我们的标题更偏资讯化■◆。而更有网感的标题，主要是在微信公众号端。因为微信是一个更注重社交分享的平台，读者可能有时分享某篇文章，标题就代表了TA的态度和想法，或者说读者单纯觉得内容挺有意思。我们会去基于使用场景去考虑标题怎么写◆★★◆◆。

　　通过完整的数据分析和挖掘之后，撰稿人可以了解全貌◆◆★■★，在得出相应的结论的同时◆◆★★，可能也会注意到其他更有意思的结论，以此来调整操作的逻辑和思路都是常发生的。但我们比较忌讳的是■◆★，撰稿人已经判断出数据无法支撑某个结论了，还要硬找一些依据去写■◆■，或者撰稿人放弃用数据来证明这个结论，而找一些话题类的内容来拼凑。

　　如果选题的数据来源极其丰富，维度非常多，我们有时也会做只有描述现象的选题，将其中的复杂趋势◆★、复杂变化情况说清楚就足够了。

　　很多情况下◆★◆，我们没有办法拿到时效性强的最新数据■◆★■★◆，但也不建议去使用媒体采访中某些机构透露的零散的数据◆★★◆■■。

　　A：首先，很多文本类数据是很难收集的，需要撰稿人有成熟的数据爬取能力。如果撰稿人能力有限，在筛选文本范围时，我会建议他选择有把握的且相对准确的数据收集方式。而不是贸然尝试难度大的方式◆◆◆◆★，最后得出一个错误的结论。举例来说，对于某个话题不需要去爬取全部用户观点★■◆■，撰稿人可以爬取前十个互动效果最好的观点，再去分析它们呈现的内容■◆■■。

　　在初稿阶段，我会关注稿件的逻辑■■★◆■★，确保文章的行文方式能够帮助读者清晰地把握重点◆★。同时■◆◆★■，我会检查撰稿人是否充分阐述了文章的核心观点◆★■、是否有案例以增进读者的理解。以上内容没有太大问题之后■■★◆■★，我们才会去看作品细致的表达，比如文章的措辞、过渡性文案、开头、结尾的内容等■◆。

　　有时，可能就是看到新闻报道中某个采访对象随口说了一句话，但编辑觉得有点意思■■★★，就会去找它的出处。去看这句话背后是否有新的现象或趋势值得挖掘，这其实就是对选题的敏感度■★◆★◆。

　　谷雨数据一直以来遵守的原则就是，希望结论的呈现尽可能清晰，而不需要拿着这张图仔细阅读，然后去读出来结论◆■★■★■。当然，如果读者感兴趣的话，也可以去细细看一下相关内容的数据表现。

　　2018年腾讯新闻谷雨工作室成立谷雨数据栏目■◆，郝昊认为，谷雨数据是用“排除法■★◆★”来找到数据新闻这一方向的■◆：■★■“信息长图的内容增量有限且不适合移动端的阅读习惯，融合报道又需要庞大的人力资源。■★◆★★”在与谷雨工作室选题方向保持一致的前提下，谷雨数据采用了“编辑主导、撰稿人合作”的模式。一般情况下，编辑根据撰稿人的专业领域、文字风格和写稿经历派发选题，撰稿人进行数据分析■◆、制图与文案撰写，再由编辑最终把关★■◆◆★。

　　Q★★◆★：谷雨数据的选题中有一类是与科学新闻相关的■■◆★，这种选题在操作上有哪些特别的注意事项吗■■★■？

　　我们前不久做了一篇的作品（以下简称《ADHD》）■■◆★★★，与多动症的话题有关，撰稿人的初稿就有这样的问题，TA一开始可能以为大家都知道多动症是什么，所以在稿件中就没有做解释，直接就描述多动症面临的问题、患病率★■◆◆★■，缺少基本信息的呈现。

　　其次■★◆★★■，这篇稿件的操作非常扎实。一是撰稿人查阅了很多文献◆■★◆■■，结合了大量新鲜的文本分析。这篇稿件先是从抑郁症内容入手，讲述了患病数据、老年女性得抑郁症存在诸多误区、治疗情况等内容，又延展到了中老年女性面临很多困境这一现象，也关注到了抑郁走失的这一群体，讲述了因为家庭困境离家出走的苏敏的故事■★。这篇作品并没有局限于常规疾病报道中常见的患病现状、治疗方法等内容，而是挖掘出了庞大的信息增量★★◆，呈现出了很多超出我们预期的内容。撰稿人对文本分析的处理也非常细致◆■◆，最后呈现出的文案易懂且非常细腻、感人。

　　A◆★■■◆◆：谷雨数据有一套非常完整的制图规范★◆◆■。里面会有建议的色卡、图表形式以及字号要求等。对于不同的数据类型■◆★★◆★，我们有不同的建议形式★■■■◆★，在规范中都有相关说明。如果超出了这些形式，设计者会在制图之前就会和编辑进行沟通，一般他们会找一个参考来询问我们的建议。

上一篇

翕见年画从文化梳理到感性创造从数据艺术可视化到信息设计

贝斯特登录入口

解决方案

研发创新

资源中心

投资者关系

加入我们

关于我们