开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

如何用python编写链接预测精度评估代码？

链接预测是图论中的一个常见问题，通常用于社交网络、生物信息学和推荐系统等领域。链接预测的目标是预测图中未观察到的边。评估链接预测算法的精度通常涉及使用一些标准指标，如AUC（Area Under the ROC Curve）、精确度（Precision）、召回率（Recall）和F1分数。

以下是一个简单的Python示例，展示如何使用NetworkX库来生成一个图，并使用自定义的链接预测算法来评估其精度。我们将使用Jaccard系数作为简单的链接预测方法。

首先，确保安装了NetworkX库：

pip install networkx

然后，编写以下Python代码：

import networkx as nx
from sklearn.metrics import roc_auc_score, precision_recall_fscore_support
import numpy as np

# 创建一个示例图
G = nx.karate_club_graph()

# 分割图为训练集和测试集
def split_graph(G, train_frac=0.8):
    edges = list(G.edges())
    np.random.shuffle(edges)
    split_idx = int(train_frac * len(edges))
    train_edges = edges[:split_idx]
    test_edges = edges[split_idx:]
    return train_edges, test_edges

train_edges, test_edges = split_graph(G)

# 训练集图和测试集图
G_train = G.copy()
G_train.remove_edges_from(test_edges)
G_test = nx.Graph()
G_test.add_edges_from(test_edges)

# Jaccard系数作为链接预测方法
def jaccard_coefficient(u, v, G):
    if u in G and v in G[u]:
        return 1.0
    union_size = len(set(G[u]) | set(G[v]))
    if union_size == 0:
        return 0.0
    return len(set(G[u]) & set(G[v])) / union_size

# 预测所有非边的分数
y_true = []
y_score = []
for u in G.nodes():
    for v in G.nodes():
        if u >= v or (u, v) in train_edges or (v, u) in train_edges:
            continue
        score = jaccard_coefficient(u, v, G_train)
        y_true.append(int((u, v) in test_edges or (v, u) in test_edges))
        y_score.append(score)

# 计算AUC
auc = roc_auc_score(y_true, y_score)
print(f"AUC: {auc}")

# 计算精确度、召回率和F1分数
precision, recall, f1, _ = precision_recall_fscore_support(y_true, np.array(y_score) > np.median(y_score), average='binary')
print(f"Precision: {precision}")
print(f"Recall: {recall}")
print(f"F1 Score: {f1}")

这段代码首先创建了一个示例图（Zachary's karate club graph），然后将其分割为训练集和测试集。接着定义了一个简单的链接预测方法——Jaccard系数，并计算了所有非边的预测分数。最后，使用这些分数来计算AUC、精确度、召回率和F1分数。

请注意，这只是一个简单的示例，实际应用中的链接预测任务可能需要更复杂的图分割策略、特征工程和机器学习模型。此外，对于大型图，可能需要使用更高效的算法和数据结构来处理计算。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Python热文Top10，精选自1000篇文章

文章主要介绍了 3.7 版本的 Python 新特性，包括：通过内置的新 breakpoint() 更轻松地访问调试器使用数据类创建简单类自定义访问模块属性改进了对类型提示的支持更高精度的定时功能...其中主要涉及 NumPy 和 Pandas，如单行 list 的理解，lambda 函数等。...文章介绍了在编写安全代码时比较普遍且容易被攻击的 10 个问题以及避免这些问题的方法。...No.9 使用 PyFPDF 和 Python 创建 PDF 这篇教程详细介绍了如何使用 PyFPDF 和 Python 创建 PDF，并提供了详细的代码解析。...Python 和 XGBoost 库搭建机器学习模型来预测签证申请的过程。

6486 0

OrangePi AIpro 浅上手

数据增强：采用多种数据增强技术，如Mosaic数据增强，增加训练数据的多样性和鲁棒性。网络混合精度训练：支持混合精度训练，可以在保证精度的同时提高训练速度。...自适应锚框：根据训练数据自动调整锚框尺寸，提高边界框的预测精度。...性能评估性能评估是了解模型精度、召回率、速度等指标的重要手段。YOLOv5的性能评估指标包括：精度（Precision）：模型正确预测的正类别目标数量与总预测正类别目标数量的比率。...召回率（Recall）：模型正确预测的正类别目标数量与总正类别目标数量的比率。 F1分数：精度和召回率的调和平均值，用于综合评估模型性能。...平均精度（mAP）：用于多类别目标检测的评估指标，计算每个类别的精度并取平均值。代码实现与训练 YOLOv5的代码实现基于PyTorch深度学习框架，提供了训练和推理的功能。

2091 0

如何用PEP 8编写漂亮的Python代码

为什么编写可读的代码是Python语言的指导原则之一？正如GuidovanRossum所说，“代码被读的频率比它所写的要多得多。”您可以花几分钟或一整天编写一段代码来处理用户身份验证。...如果您是Python新手，那么在编写代码之后的几天或几周内，很难记住一段代码所做的事情。如果您遵循PEP 8，您可以确保您已经很好地命名了变量。...如果您有更多编写Python代码的经验，那么您可能需要与其他人协作。在这里编写可读的代码是至关重要的。其他人，他们可能从来没有见过你或看过你的编码风格，将不得不阅读和理解你的代码。...拥有您遵循和认可的指导方针将使其他人更容易阅读您的代码。命名公约 “明示胜于含蓄。” — Python的禅宗在编写Python代码时，必须指出很多事情：变量、函数、类、包等等。...— Python的禅宗您应该在编写代码时使用注释来记录代码。重要的是记录您的代码，以便您和任何协作者都能够理解它。

1K1 0

如何用pycharm编写程序_pycharm怎么编写python代码

一、编写第一个Python项目二、使用Pycharm编写第一个Python程序运行Pycharm,选择Create New Project,创建一个新的Python工程。...选择’Pure Python’创建一个新的纯Python工程项目，Location表示该项目的保存路径，Interpreter 用来指定Python计时器的版本。...右击项目，选择New，再选择Python File 在弹出的对话框中输入的文件名HelloPython，点击OK，表示创建一个Python程序的文本文件，文本文件后缀名默认.py 在新建的HelloPython.py...文件里，输入以下代码，并在空白处右键选择Run运行，表示输出一段hello world字符串。...发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/173172.html原文链接：https://javaforall.cn

2.6K2 0

独家 | 如何用XGBoost做时间序列预测？

作者：Jason Brownlee 翻译：wwl 校对：王雨桐本文约3300字，建议阅读10分钟本文介绍了如何用XGBoost做时间序列预测，包括将时间序列转化为有监督学习的预测问题，使用前向验证来做模型评估...它兼顾了速度和效率，且在很多预测模型任务中表现优异，在数据科学比赛中广受赢家偏爱，如Kaggle。 XGBoost也可以用于时间序列预测，尽管要先把时间序列数据集转换成适用于有监督学习的形式。...有关此功能逐步开发的更多信息，请参阅教程：《如何在Python中将时间序列转化为监督学习问题》链接：https://machinelearningmastery.com/convert-time-series-supervised-learning-problem-python...你可以使用本节的代码来开始自己项目，它可以轻易的转化应用于多变量输入、多变量预测、多步长预测。...https://machinelearningmastery.com/time-series-forecasting-supervised-learning/ 如何用Python 将时间序列问题转化为有监督学习问题

4.4K2 0

利用Libra进行机器学习和深度学习

但仍然需要遵循包括数据准备、建模、评估在内的整个过程。数据准备包括数据清理和预处理。建模接受预处理的数据并使用算法来预测结果。评估为我们的算法的性能提供了一个度量。...由于这些库和框架，我们编写所有东西的时间减少了，但是我们仍然需要编写少量的代码。 ? ❝“机器智能是人类最后一个需要创造的发明。”...只需两行代码，我们就得到了大约0.99的分数，这是我们能得到的最好成绩。如果你检查其他人的成功，你会发现只有少数人获得了0.99的准确率，他们花了数小时来预处理数据并为其编写代码。...使用下面的代码，你可以创建CNN。数据将通过缩放、剪切、翻转和重新缩放自动增加。然后选择最佳的图像大小。你还将注意到每个类中的图像数量以及与之关联的类的数量。最后，还要观察训练精度和测试精度。...从上面的代码中，你可以注意到模型使用的初始层数是3。然后，它还测试了不同层数的精度，这些层数根据前一层的性能而变化。它可以预测找到的最佳层数以及训练和测试的准确性。

4742 0

基于深度学习检测驾驶员的走神行为

在验证集上看精度accuracy. 然后尝试改造模型和自己建模，在验证集上看精度accuracy。...我的目标是 accuracy > 0.93 并且 logloss < 1.0 并且世界排名前 1/3 评估指标这是典型的分类问题，评估指标采用 1. 精度accuracy来评估结果好坏。 2....，然后重新用神经网络训练全链接层。...《美团机器学习实践》_美团算法团队.pdf 《深度学习入门：基于Python的理论与实现》高清中文PDF+源码《深度学习：基于Keras的Python实践》PDF和代码特征提取与图像处理(第二版...笔记、代码清晰易懂！

9501 0

机器学习中时间序列预测的一些常见陷阱

我将通过一个具体的例子展示看起来拥有了一个好的模型并决定投入生产，而实际上该模型可能没有任何预测能力，更具体地说，我将专注于如何评估你的模型精度，并向您展示如果只是简单地依赖常见的误差指标（如平均百分比误差...如何使用开源软件库实现模型我通常使用Keras来定义神经网络类型的模型，Keras是一个高级神经网络API，用Python编写并且能够在TensorFlow，CNTK或Theano之上运行。...精度指标的不当使用会产生误导这意味着在根据直接预测值的能力评估模型时，常见的误差度量（例如平均百分比误差和R2分数）都表明模型具备高预测精度。...作者说明：在发表文章后，我发现了Jason Brownlee一篇同一主题的精彩文章，该文章对随机漫步和时间序列进行了类似处理用Python编写随机漫步时间序列预测 https://machinelearningmastery.com.../gentle-introduction-random-walk-times-series-forecasting-python/ 总结我想通过本文强调的主要观点，是根据预测精度评估模型性能时需要非常小心

3.9K4 0

一个实例读懂监督学习：Python监督学习实战

【导读】1月28日，Vihar Kurama和Sai Tejaswie撰写了一篇机器学习技术博文，为读者介绍了如何用python进行监督学习。...在文末给出了文章中实例代码链接，感兴趣的读者不放自己跑一下。专知内容组编辑整理。 ?...测试集用于估计分类器的预测精度。分类器的精度是被分类器正确分类的测试样本所占的百分比。为了达到更高的精度，最好的方法是测试不同的算法，并在每个算法中尝试不同的参数。最好的方法是利用交叉验证。...现在我们进入代码并探索IRIS数据集。确保你的机器上安装了Python。...用距离（如欧式距离）的大小定义“亲密度”。 K的值是通过实验确定的。在下面的代码中，我们从sklearn中导入KNN分类器，并将其应用到我们的输入数据，然后对花进行分类。

3.9K7 0

独家 | 如何用简单的Python为数据科学家编写Web应用程序？（附代码&链接）

更别提如何用多种方式去实现同一件事了，这会让数据科学同胞感到更加困惑，毕竟对他们来说，Web开发只是一项次要的技能。那么，我们注定要学Web框架吗？...Streamlit还有一些内置的图表类型，如st.line_chart 和st.area_chart等都能在Streamlit中运行。...此处将使用plotly_express创建简单应用程序，代码如下。仅调用Streamlit四次，余下的便都是一些简单的python代码操作。...在我看来，最好的方法就是使用Magic命令，Magic命令允许您像注释一样轻松地编写标记，也可以使用st.markdown命令。...原文标题： How to Write Web Apps Using Simple Python for Data Scientists 原文链接： https://www.kdnuggets.com/2019

1.9K1 0

PYTHON集成机器学习：用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化

原文链接：http://tecdat.cn/?p=24231 Boosting 是一类集成机器学习算法，涉及结合许多弱学习器的预测。弱学习器是一个非常简单的模型，尽管在数据集上有一些技巧。...现在我们熟悉了 AdaBoost 算法，让我们看看如何在 Python 中拟合 AdaBoost 模型。...下面列出了关键代码片段示例。...AdaBoost Ensemble 弱学习器深度与分类精度的箱线图。 ---- 点击标题查阅往期内容如何用R语言在机器学习中建立集成模型？...注意：考虑到算法或评估程序的随机性，或数值精度的差异。考虑多次运行该示例并比较平均结果。

1.5K2 0

（附论文、项目链接）

本文工作将 MegaFace 的精度提升到 98%，超过俄罗斯 Vocord 公司保持的 91% 的纪录。...论文链接:https://www.paperweekly.site/ papers/1785 项目链接:https://github.com/deepinsight/ insightface 02 #Python...图像增强库 Augmentor 是一个 Python 图像增强库，减少了使用图像库自己编写代码的繁杂工序，能够批量完成图像的旋转，放大，缩小，添加噪音以扩充数据量。...▲ 股票交易收益对比 ▲ 股价预测结果项目链接:https://github.com/ceruleanacg/ Personae 06 NNDial #端到端对话系统开源工具包 NNDial 是一个用于构建端到端可训练任务型对话模型的开源工具包...在评估阶段，使用了多进程加速，将 MeanRank 和 Hits@10 的评估时间压缩到小于 1 分钟。

1.1K2 0

Python & 机器学习项目集锦 | GitHub Top 45

风格编写的模块，通过导入所需的算法，获得相应的代码、时间复杂性等。...我们如何预测接下来会发生什么？这篇文章将简单地介绍如何使用Python来分析加密货币。文章通过一个简单的Python脚本来检索，分析和可视化不同加密货币上的数据。...链接： http://www.labri.fr/perso/nrougier/from-python-to-numpy/ ㉛探索Python每种工具包的行长度本文探索了Python的流行包，如NumPy...Tselai 链接： https://tselai.com/greek-wines-analysis.html ㊱如何用 Python 生成 FiveThirtyEight 图这篇文章将用Python...链接： https://coolpythoncodes.com/best-way-learn-python-programming ㊺如何用Python实现强大的数据分析 Python是数据分析的最佳编程语言

1.8K4 0

机器学习即服务之BigML特性介绍和入门教程

多分类器融合可以提高你的预测准确度多分类器融合，涉及多个可供选择的模式，这将提供更好的预测性能，是一种能提高你的单模型系统的精度的有据可查的方式。...它使得总精度提升了2.82％，而且有些类更是高达5.34％。你可以与比较评估操作比较两个评估，呈现的是有着单一评估的相同的统计，以及对每个指标的相对比例相同的统计数据。 ?...产生新的API绑定和BigMLer的预测我要说的是BigML既方便用户也方便开发人员。他们花时间来编写大量的API客户端，甚至是一个称为BigMLer命令行工具。...我选择了Python进行绑定，并编写了一个简单的脚本来生成新的预测。...大会官网链接：http://ccai2015.csdn.net

1.5K5 0

ML Mastery 博客文章翻译 20220116 更新

从零开始创建算法测试工具通过创建机器学习算法的目标列表来获得控制权机器学习中算法和模型的区别停止从零开始编写机器学习算法在实现机器学习算法时，不要从开源代码开始不要使用随机猜测作为基线分类器...中从零开始实现反向传播算法如何用 Python 从零开始实现装袋如何用 Python 从零开始实现基线机器学习算法如何在 Python 中从零开始实现决策树算法如何用 Python 从零开始实现学习向量量化...5 种技巧最好的机器学习算法从零开始在 Python 中实现 K 最近邻通过从零开始实现机器学习算法来理解它们（以及绕过坏代码的策略）使用随机森林：在 121 个数据集上测试 179 个分类器...速成课机器学习的四种距离度量如何用 Python 开发弹性网络回归模型使用 Python 和 scikit-learn 的集成机器学习算法在 Python 中使用重采样评估机器学习算法的表现...重采样和插值您的时间序列数据使用 Python 为时间序列预测编写 SARIMA 如何在 Python 中保存 ARIMA 时间序列预测模型将 Python 用于季节性持久性预测基于 Python

3.4K3 0

GitHub Top 45：新手入门 Python，值得推荐的优质资源！

Mybridge AI 的排名结合了内部机器评估的内容质量和各种人为因素，包括阅读次数和阅读时长等。 ?...最重要的 Python 算法 --Pygorithm Pygorithm 是一个纯 Python 风格编写的模块，通过导入所需的算法，获得相应的代码、时间复杂性等。...用 Python 分析加密货币市场比特币市场是如何表现？加密货币价值突然出现高峰和低谷的原因是什么？不同 altcoins 市场是不可分割的或基本独立的？我们如何预测接下来会发生什么？...记忆代码优化你的程序，在某些情况下会加速你的代码运行。链接： https://dbader.org/blog/python-memoization Python 中的 Django 框架 26....如何用 Python 实现强大的数据分析 Python 是数据分析的最佳编程语言，这得益于它自带的依赖库。

1.4K2 0

深度学习目标检测指南：如何过滤不感兴趣的分类及添加新分类？

▌如何评估深度学习目标检测模型的精度？当评估目标检测模型的性能时，我们使用的评价指标是平均精度均值（mAP ），mAP是基于我们数据集中所有类别的交并比（ IoU ）计算得到的。...交并比（ IoU ）图 5：在这个交并比 IoU 的直观例子中，将真实值的边框（绿色）与预测的边框（红色）进行对比。IoU 与平均精度均值 mAP 一起被用于深度学习目标检测的精度评估。...任何用来提供预测边框（以及供参考的类标签）作为输出的算法，这些算法均能是用 IoU 进行评估。更正式地说，为了使用 IoU 来评价任意一种目标检测模型，我们需要： 1....平均精度均值（ mAP ）为了在我们的数据集中评估目标检测模型的性能，我们需要计算基于 IoU 的mAP：基于每个类（也就是每个类的平均精度）；基于数据集中的所有类别（也就是所有类别的平均精度值的平均值...如果你遇到问题，请查看链接（https://www.pyimagesearch.com/2018/03/12/python-argparse-command-line-arguments/）。

2.2K2 0

深度学习目标检测指南：如何过滤不感兴趣的分类及添加新分类？

▌如何评估深度学习目标检测模型的精度？当评估目标检测模型的性能时，我们使用的评价指标是平均精度均值（mAP），mAP是基于我们数据集中所有类别的交并比（IoU）计算得到的。...交并比（IoU）图 5：在这个交并比 IoU 的直观例子中，将真实值的边框（绿色）与预测的边框（红色）进行对比。IoU 与平均精度均值 mAP 一起被用于深度学习目标检测的精度评估。...任何用来提供预测边框（以及供参考的类标签）作为输出的算法，这些算法均能是用 IoU 进行评估。更正式地说，为了使用 IoU 来评价任意一种目标检测模型，我们需要： 1....平均精度均值（mAP）为了在我们的数据集中评估目标检测模型的性能，我们需要计算基于 IoU 的mAP：基于每个类（也就是每个类的平均精度）；基于数据集中的所有类别（也就是所有类别的平均精度值的平均值...如果你遇到问题，请查看链接（https://www.pyimagesearch.com/2018/03/12/python-argparse-command-line-arguments/）。

2.1K3 0

让你的电脑拥有“视力”，用卷积神经网络就可以！

To See With Convolutional Neural Networks 作者 | Alex Yu 翻译 | zackary、chesc 校对 | 酱番梨整理 | 菠萝妹原文链接...卷积神经网络极大地提升了图像识别模型的精度，在生活中也有很多的应用。在这篇文章中，我将描述它的工作原理、一些实际应用，以及如何用Python和Keras是实现一个卷积神经网络。 ?...一旦网络做出了它的预测，它将使用一个损失函数来评估自己的误差，并更新自己的权重以在下一次获得更好的结果。卷积神经网络包含一些层：卷积层和池化层。...通过使用十分先进的算法，神经网络可以疯狂地高精度对图像进行分类。有些模型已经在这个任务中击败了人类！...我们可以在Python里使用Keras框架创建一个卷积神经网络，其中Keras是一个用Python编写的高级API。Keras可以帮助我们编写易于理解和可读性强的代码。

6503 0

ML Mastery 博客文章翻译（二）20220116 更新

CNN 评估图像分类的像素缩放方法如何开始计算机视觉深度学习（7 天迷你课程）如何在 Keras 从头开发 VGG、Inception 和 ResNet 模块如何使用 PIL/Pillow 如何用...如何用 Python 开发装袋集成使用 Python 的混合集成机器学习如何组合集成学习的预测 Python 中的动态分类器选择集成 Python 中用于分类的动态集成选择(DES) 机器学习集成多样性的温和介绍...混合专家集成的温和介绍如何用 Python 开发多输出回归模型多模型机器学习入门 Python 中的多元自适应回归样条（MARS）多类分类的一对一和一对剩余如何在机器学习中使用折外预测如何用...Python 开发随机森林集成如何用 XGBoost 开发随机森林集成如何用 Python 开发随机子空间集成使用 Python 开发堆叠集成机器学习集成学习中强学习器与弱学习器如何在 Python...中开发超级学习器集成集成学习算法的温和介绍如何用 Python 开发投票集成如何用 Python 开发加权平均集成集成学习入门为什么使用集成学习？

4.4K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭