我正在寻找一个潜在的匹配算法应用于2个数据集( DS1,DS2),这将为所有DS1 x DS2提供一个分数。
要举例说明这个问题:想象一群求职者在找工作。什么样的工作符合求职者的个人资料,哪些求职者能与工作匹配。
任何指针或文档,你可以指示我来帮助我这个?
投入:
ID | name | skills | bio | ...
u1 | alex | C# | candidate bio blah ...
u2 | john | JVM,AWS| ...
u3 | emma | AWS,CSS| ...
ID | name | spec | skills needed | ...
j1 | C# engineer | a job spec blah ... | C#,AWS
j2 | Java developer | a job spec blah ... | JVM,AWS
j3 | VueJS developer | a job spec blah ... | CSS
产出:
j1 j2 j3
u1 0.2 0.1 0.3
u2 0.3 0.4 0.5
u3 0.6 0.1 0.3
发布于 2021-03-17 00:54:06
欢迎来到现场!没有更多的细节是很难回答的(你有多少数据?)您希望在哪些参数上对数据进行评分?)
如果您有一些以前的培训数据,您可以查看边信息推荐算法。
如果您没有任何培训数据,那么您本质上想要计算工作规范和候选人技能之间的文本相似度。要了解文本相似性度量、余弦相似度等,首先要建立这样的无监督算法,即用向量表示文本数据,其中的基本知识将在这里解释。。
https://datascience.stackexchange.com/questions/90760
复制相似问题