罗平| 岳普湖| 嵊泗| 连州| 万州| 冀州| 淳安| 李沧| 永胜| 海宁| 迭部| 耒阳| 津市| 镇沅| 明水| 无为| 武乡| 东兴| 普定| 揭西| 马龙| 肥乡| 红河| 岚县| 宾县| 筠连| 额敏| 丹巴| 惠来| 曲江| 色达| 蒙自| 左云| 碌曲| 惠东| 全州| 印台| 平湖| 成武| 凌海| 红星| 化隆| 齐河| 稷山| 张家川| 昌乐| 朔州| 宽甸| 伊宁市| 永新| 红安| 伊宁县| 连南| 祁阳| 三门| 项城| 天等| 镇平| 宁陵| 科尔沁左翼中旗| 阜新蒙古族自治县| 乌拉特前旗| 德钦| 泰安| 乐亭| 西丰| 郸城| 马鞍山| 高邮| 墨江| 息县| 永清| 永丰| 乌兰浩特| 察哈尔右翼中旗| 叶城| 平房| 罗山| 乌拉特前旗| 房山| 南充| 北戴河| 华安| 兴文| 东西湖| 万州| 江油| 许昌| 连山| 上高| 婺源| 万宁| 唐海| 湘潭市| 营山| 商水| 剑河| 新河| 辽阳市| 固始| 湄潭| 屯昌| 安康| 四方台| 奉新| 鸡西| 富拉尔基| 沙湾| 南部| 昆明| 安国| 秦皇岛| 久治| 项城| 且末| 白银| 通榆| 黄平| 义马| 房山| 泉港| 乌兰浩特| 嘉禾| 大港| 镇原| 兴化| 沙湾| 湖州| 沂源| 马龙| 高青| 增城| 柯坪| 武宁| 阜阳| 临安| 小河| 八一镇| 江孜| 崂山| 古浪| 安西| 皮山| 广宁| 岫岩| 仁布| 白银| 麻江| 资源| 道孚| 普定| 乌拉特前旗| 莘县| 牙克石| 黎川| 康马| 广南| 滦平| 卢龙| 江都| 安县| 遂川| 陈仓| 民乐| 永安| 辽中| 潼关| 崇礼| 林口| 齐河| 平凉| 三门| 南投| 玛纳斯| 喜德| 新晃| 龙里| 德令哈| 永泰| 石狮| 建水| 德保| 蒙山| 西固| 仪征| 绩溪| 金坛| 隆德| 湘阴| 铜梁| 清徐| 铁山| 芦山| 华容| 广德| 漳平| 南岳| 连云港| 阜城| 石家庄| 水城| 朝阳市| 嵊泗| 奉节| 寒亭| 乐安| 新民| 新巴尔虎左旗| 淳化| 阿荣旗| 滨海| 安泽| 铁力| 奉化| 东胜| 隆安| 沿滩| 呼玛| 闽侯| 大悟| 绵竹| 岐山| 夏河| 武宣| 万年| 浦东新区| 新宁| 五河| 郫县| 长寿| 鄯善| 防城港| 天峻| 环江| 宁陕| 朝阳县| 广灵| 上思| 肃南| 修水| 西安| 丹徒| 巴中| 光泽| 茶陵| 镇坪| 屯昌| 金堂| 响水| 吉水| 新巴尔虎左旗| 延安| 津南| 铁岭市| 定州| 霍州| 蓝田| 莫力达瓦| 赤峰| 依兰| 苏尼特左旗| 西宁| 古蔺| 泸水| 博彩吧
|
|
51CTO旗下网站
|
|
移动端
创建专栏

跨职能合作,优秀的数据产品如何三步炼成

所谓“数据产品”的生命周期反映了当前基本的产品开发现状:找到解决用户核心需求的机会,建立一个初始版本,然后评估其影响并进行迭代。

作者:大数据文摘|2019-01-18 15:27

优秀的数据产品

大数据文摘出品

编译:韦梦夙、张秋玥、蒋宝尚

结合了数据与机器学习的产品可成为解决用户需求的利器。它们能够创造一条可以帮你避免激烈竞争的“数据护城河”。

当前已经有了一些非常经典的案例,例如谷歌搜索引擎以及亚马逊产品推荐系统,两者利用数据与机器学习做出的改进都吸引了更多用户使用它们的产品。

但是机会并不会只青睐技术巨头:各个领域各种规模的公司都在投资它们自己的数据产品。在Coursera,我们使用机器学习帮助学习者寻找最佳的内容去达成他们的学习目标,保证他们获得成功所需要的支持——无论是机器支持,亦或人工支持。

所谓“数据产品”的生命周期反映了当前基本的产品开发现状:找到解决用户核心需求的机会,建立一个初始版本,然后评估其影响并进行迭代。

但是数据的引入增加了一层额外的复杂度。为了应对此挑战,公司应该加强跨职能合作,用长期眼光去评估并优先考虑数据产品机会,然后从简单之处开始做起。

阶段1:辨识机会

数据产品

1. 数据产品是一项团体运动

找到最佳的数据产品机会需要把产品业务的洞察和技术数据的洞察结合起来。产品经理、用户研究员以及商务领袖们通常有很强的直觉和领域专长去辨识关键且尚未解决的用户与业务需求。与此同时,数据科学家和工程师们拥有敏锐的眼光去辨识可行的数据驱动解决方法;他们还在什么能够拓展和如何拓展等问题上有很强的直觉。

为了辨识并优先考虑正确的数据产品机会,我们需要让讨论桌上的各方聚到一起。如下的几条规范就能够很有帮助:

让数据科学家认识用户和业务需求。保持数据科学家与产品经理、用户研究员、商业领袖的紧密联系,以保证他们能够直接深入挖掘数据来理解用户以及他们的需求。

让数据科学家承担数据传播者的角色,与整个公司交流数据能够带来的机会。这包括从为公司提供更易于使用的原始数据、在早期构想阶段即提供模型输出样本,到在后期搭建全功能产品样本。

培养具有良好数据意识的产品与业务小组。不同职能与行业的人们都在提高自己的数据相关能力,而雇主们则能够通过投资培训项目来加速这个趋势。产品与业务部门的数据相关能力越强,他们就能够更好地和数据科学以及技术小组合作。

讨论桌上为数据科学保留一席之地。数据科学能在组织不同的地方存在(无论是集中或去中心化的管理模式),但是无论是什么样的组织形式,参与产品与商业策略讨论的数据科学领袖们都能够帮助加速数据产品的开发。

2. 优先考虑未来

最好的数据产品像美酒一样,随着时间流逝会变得越来越好。有如下两个原因:

  • 首先,数据产品应用通常能够加速数据的收集,反之又有助于提高应用本身。设想一个基于用户自反馈资料数据的推荐系统产品吧:目前使用有限的个人资料数据,初始推荐系统可能效果并不明显。但如果用户在个性化自己的偏好时拥有有非常强的意愿去补充资料,这将推动推荐系统去加速收集资料数据,逐渐提高推荐系统的效果。
  • 其次,许多数据产品能够支持多种应用。这不仅是为了在各件应用上均摊昂贵的研发成本,还是通过共享数据加强网络效应。各种应用产生的数据反馈给底层数据架构,有助于提升应用的利用率和数据收集——这样的良性循环将持续进行。Coursera的技能图就是其中一个例子。一系列算法给课程内容、职业生涯以及学习者本身匹配了一个强大的技能库。该技能图加强了一系列帮助发现相关课程的应用表现,而其中许多应用产生了增强技能图的训练数据,反过来提高应用的效果。

过度关注近期表现会错失中长期的机会。普遍来说,高质量数据的关键性不容小觑。每一个步骤都应该在收集和储存数据上优先投资。

阶段2:建设产品

数据产品

通过分布执行来降低风险

数据产品通常需要验证算法是否有效和用户是否喜欢。因此,数据产品的建设者面临着一个固有的矛盾——在前期研发上投资多少,以及尽快发布应用以验证它是否能够解决某一核心需求的速度。

在验证产品与市场是否匹配之前过度投资于技术验证,会加大研发力量浪费在错误的问题或者解决方案上的风险。反过来,缺乏有效研发、仅仅过度投资于用户需求验证会导致呈现给用户一个无力的样品,会有被错误否定的风险。偏向于后者的团队也许会产生一个由并不有力的模型驱动的MVP(Minimum Viable Product,最小可行产品)。如果用户反馈差强人意,那当我们投入更高研发力度去改善产品时结果其实有可能将有所不同。

当没有合适手段同时验证技术并测评产品与市场是否匹配时,分布执行就能够帮得上忙了。从简单部分入手将能够加速测试以及收集高价值数据。在建立技能图的过程中,我们起初推出基于技能的搜索——一项只需要技能图一个小子集的应用。它随后产生了丰富的训练数据。如下一系列MVP方法同样能够减少测试时间:

  • 轻量级模型通常搭建并投入市场更快,而且更容易解释、调试并逐渐升级。虽然深度学习在大部分案例中非常有用(确实是一个趋势),但它并不适合被用于数据产品启动阶段。
  • 外部数据资源——无论是公开资源、购买资源或合作伙伴的解决方案——都能够加速数据产品的开发。如果产品产生的数据中可以明显看出(某个特性)很受欢迎或很有效果,该产品就可以向该有竞争力的方向进行改进,或直接将其作为卖点。
  • 在起步的时候缩小适用领域能使算法不那么具有挑战性。例如,一些应用在初始搭建阶段时可以先着眼于一小部分用户群体或适用范围。
  • 手工处理——要么人工完成你希望最终机器模型能做的事情,要么至少是人工评估调整初始模型的输出——都能更进一步加速开发。着眼于让手工综合处理的步骤能随时间推移实现自动化以提高产品的效果,将会十分理想。

阶段3 评估和迭代

数据产品

1. 当评估数据产品表现时,思考其未来的潜力

在发布产品后评估结果就对数据产品做出有用或者无用的定论不像简单的UI调整那么直接。这是因为,当你收集到更多数据的时候,数据产品的效果基本都会提高,而且基础数据产品会随着时间推移实现更多功能。在封装一个没有明显优于竞争对手的数据产品前,请你的数据科学家准备好一些重要问题的回答。例如,产品和原先比数据收集效率提升了多少?提高算法效果上有多少成果?未来将会解锁什么样的应用?基于这些问题的回答,一件当前指标并不耀眼的产品也许其实值得保存下来。

2. 迭代速度很重要

数据产品经常需要在算法和UI上进行迭代。挑战在于决定在哪里进行迭代的价值最高。数据和用户反馈将帮助团队知道什么功能需要改进。算法迭代成为核心时(通常在复杂的推荐系统或者通信系统中算法迭代会无比重要,比如Coursera的个人学习干预项目算一个),我们将需要考虑到系统设计是否方便数据科学家在开发中独立地部署并测试新模型。

在产品与商业领袖和数据科学家之间培养合作的默契,优先考虑用未来的眼光投资,然后从简单之处开始起步,任何类型和规模的公司都能加速开发出能有效解决用户核心需求的数据产品,以给为企业添加能量,创造持续性的竞争力。

相关报道:https://hbr.org/2018/10/how-to-build-great-data-products

【本文是51CTO专栏机构大数据文摘的原创译文,微信公众号“大数据文摘( id: BigDataDigest)”】

     大数据文摘二维码

戳这里,看该作者更多好文

【编辑推荐】

  1. 万字长文揭秘:阿里如何实现海量数据实时分析?
  2. 阿里巴巴的大数据之路:JStorm与Blink的发展史
  3. 2019年五大攻击形式和数据泄露的八大预测
  4. 数据科学家“恐怖故事”
  5. 真实与炒作,发展与失望并存的一年:大咖共同回首数据科学与分析的2018和展望2019
【责任编辑:赵宁宁 TEL:(010)68476606】

点赞 0
大家都在看
猜你喜欢
北沟沿胡同 羊毛衫九厂 红阳 塔拉沟门 常营民族小区
蓝靛厂中路 通州杨庄北口 白楼村委会 会同县 胜利街
葡京网上赌场 99真人 龙虎斗游戏网站 pt电子游戏破解 澳门正规博彩十大网站
威尼斯人网址 真钱麻将游戏 巴比伦赌场官网 mg电子网址 澳门威尼斯人官网
澳门地下开户 真钱游戏平台 mg电子游戏网站 威尼斯人网站 澳门大富豪博彩注册
澳门百老汇赌博 电子游戏平台 真钱斗地主 澳门威尼斯人平台 澳门银河网址
老虎机定位器 澳门大富豪网址 现金三公注册网址 牛牛游戏下载 现金骰宝 年度十大电子游戏 大小点游戏 玩什么游戏可以挣钱 电子游戏厅 方法奇葩赌博网 巴黎人网站 pt电子游戏哪个最会爆 澳门巴黎人游戏 澳门龙虎斗注册 澳门大富豪网站 押大小排行 真钱打牌 明升网站 十三水技巧 电子游戏下载 二十一点平台 现金网游戏开户平台 澳门百老汇游戏官网 皇博压大小 真钱捕鱼 跑马机游戏 赌博技巧 巴比伦赌场官网 现金三公 地下网址 捕鱼游戏技巧 英皇网站 手机玩游戏赚钱平台 现金网排行 pt电子游戏注册 赌博技巧 电脑玩游戏赚钱平台 海立方游戏 ag电子游戏排行 希尔顿官网 太阳网上压大小 现金赌钱游戏 现金棋牌游戏 真人网站网址 地下开户 九五至尊娱乐网址 澳门梭哈游戏官网 奇葩袖赌博网 鸿胜国际压大小 博狗扑克游戏 德州扑克游戏规则 庄闲代理 奔驰宝马老虎机下载 现金三公开户注册 免费试玩电子游戏 GT压大小 新濠天地注册 现金老虎机网站 纸牌赌博种类 乐天堂开户 澳门永利平台 电脑版捕鱼达人 玩电子游戏入门 斗牛游戏 bbin压大小 网上电子游戏网址 澳门网络下注平台 明升国际网址 明升娱乐 捕鱼达人电子游戏 mg电子游戏试玩 二十一点游戏赌场 澳门万利赌场官网 大小对比网站 现金电子游戏 电子游戏实用技术 老虎机破解器 澳门梭哈官网 澳门百老汇赌场注册 千炮捕鱼兑换现金 网上合法赌场 PT电子游戏 波克棋牌官方下载 天天棋牌 凤凰棋牌 美少女战士电子游戏 什么游戏可以赚人民币 银河国际娱乐 澳门番摊官网 澳门梭哈官网 胜博发电子游戏 电子游戏打鱼机 澳门现金网 大三巴网站 PT电子游戏 澳门银河国际娱乐