个人感觉数据挖掘是一个比较大的概念,可以理解为:数据挖掘商业知识、自然语言处理技术(NLP)、计算机视觉技术(CV)、机器学习/深度学习(ML/DL)(1)商业知识具体指个性化推荐、计算广告、搜索、互联网金融等。NLP和CV分别是处理文本、图像和视频数据的领域技术,可以理解为提取非结构化数据并转换为结构化数据;最后的ml/dl技术属于模型学习理论。(2)公司在选择职位的时候,没有一套标准的职称,做的无非是两个大方向。一种是主要学习某一领域的技术,比如自然语言处理工程师、计算机视觉工程师、机器学习工程师等。一种是将各种领域技术应用到业务场景中,解决业务需求,比如数据挖掘工程师、推荐系统工程师。具体标题不重要,重要的是平时的工作内容;PS:在互联网行业,数据挖掘相关技术的成功应用主要是在推荐和计算广告领域,涉及的数据主要是文本,所以NLP技术比较重要。至于CV技术,主要应用在人工智能领域(无人车、人脸识别等。),而我的理解有限,所以相关描述会比较差。
5、计算机视觉算法是做什么的3年或以上工作经验,计算机、数学、统计等相关专业。,具有较强的解决问题的能力;具有深厚的机器学习、数据挖掘、自然语言处理背景,算法能力强;有信贷/量化交易等金融行业建模经验者优先;至少精通C/C或Java的任意一种编程语言,Python/perl/shell的任意一种脚本语言,熟练使用一种以上的数据分析和挖掘工具,熟悉Sparkml者优先;
6、机器学习和计算机视觉是什么关系从国内市场情况和发展潜力来看,机器学习是更好的选择。机器学习在人工智能领域发挥着重要的作用,可以应用于图像识别、语音识别、自然语言处理等许多领域。随着大数据和云计算技术的发展,机器学习的应用场景越来越广泛,包括金融、医疗、物流等行业。机器视觉虽然应用场景广泛,但在国内市场发展相对缓慢,受到技术、市场等诸多因素的制约。
人工智能(Artificial intelligence),英文缩写为AI,是研究和发展模拟、延伸和扩展人类智能的理论、方法、技术和应用系统的一门新技术科学。人工智能是计算机科学研究的一个重要分支,也是多学科的交叉学科。它试图理解智能的本质,并制造出一种新的智能机器,能够以类似于人类智能的方式做出反应。该领域的研究包括语音识别、图像识别、机器人、自然语言处理、智能搜索和专家系统等。人工智能可以模拟人类意识和思维的信息过程。
7、机器学习、数据挖掘、计算机视觉等的泡沫有多大?现在2016年6月,机器学习、数据挖掘、计算机视觉等应用都没有泡沫,甚至远没有算法的潜力。以我在工作中的经验来看,公司几乎每个产品线都有一些算法的地方。同时,很多新算法可以带来全新的产品功能,提升用户体验,提升公司核心指标,拓展新的营收渠道。未来三到五年,将是从自动化到算法化最快的阶段,很多公司将从中受益。各种核心指标都会翻,跑得快的公司会吃掉跑得慢的公司。
同时,由于现代技术工具和生态系统的发展,一个5到10人的全栈数据科学家团队可以支持一个公司几个核心算法的所有端到端任务,包括支持最终产品的研发。但是对于现在的创业趋势,我个人认为把各种算法拿出来做第三方服务创业是很难成功的,最核心的原因是各种算法都需要和公司的核心产品线融合,算法是公司核心产品的一部分。