从机器学习开始最简单的方法是什么?
我有一个非常实用的应用程序。
有几个经理把一个数据仓库的“东西”扔到我腿上,让我告诉他们是什么推动了销售。
这些数据包括:
sales by client (clients being doctors offices)
sales by doctor
products they bought
client demographics
all kinds of different date information
总结这些数据,基本上是公司与所有客户进行的每一笔交易的完整数据,以及每笔交易的详细信息。
所有数据都存储在server 2008中。
问题:是否已经存
我需要一个建议。我可以这样继续我的问题:
我在数据库中有一些旅行,例如:
Person1 travelled from CityA to CityB on Date1
Person1 travelled from CityB to CityC on Date2
Person2 travelled from CityB to CityD on Date3
...
我们可以认为这些城市都在完整的图表中。
现在,根据数据库中的所有旅行情况,我想知道PersonX可能会去哪里。我能知道他什么时候来(或不是)。
我不知道我是否应该使用机器学习,数据挖掘或图论。
让我解释一下我想做什么:
输入
一个csv文件,包含数百万行,其中包含每个行:用户的id和包含该用户使用的关键字<code>E 211</code>的列表的字符串。第二个字段string的格式并不那么重要,我可以根据自己的需要进行更改,例如添加这些关键字的计数。这些数据来自Twitter数据库:用户是Twitter用户,关键词是从Twitter中获取的“有意义”的单词(如何不重要)。
样本行
这是当前csv的一行的样子:
(用户id,关键字)
"1627498372", " play house business card"
目标
考
有人刚刚告诉我的老板,数据挖掘可以对一个公司做什么,比如推荐,预测模型。基本上我们是一家网站公司。我要休假6个月。所以我的老板说我可以学习一些DM技术,等我回来的时候,我们可以访问小商店或小公司,用数据挖掘算法向他们提供预测数据。
商店将只为客户或更多人提供sql文件或csv文件。
现在我只知道MYSQL,不知道数据挖掘是什么,也不知道它是否像我上面想的那样工作,我的意思是,如果有人拥有客户数据库,购物和我可以应用数据挖掘技术。我是说
(raw mysql or sql data) or (csv files) ----data mining--> (some useful result