Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >智能云上手指南:如何将历史数据迁移到万象优图

智能云上手指南:如何将历史数据迁移到万象优图

原创
作者头像
腾讯云开发者社区
修改于 2017-10-18 08:34:47
修改于 2017-10-18 08:34:47
2.2K10
代码可运行
举报
运行总次数:0
代码可运行

6 月 21 日,腾讯云在 2017「云+未来」峰会上推出了战略新品——智能云,宣布将腾讯积累近 20 年的 AI 能力向政府、企业和开发者开放,其中首批开放计算机视觉智能语音识别自然语言处理的三大核心能力。腾讯云技术社区陆续推出了系列文章,向普通开发者分享如何快速接入并使用这三大 AI 能力,节省自身的开发成本,同时极大提升开发效率和用户体验。

本文将为广大云开发者介绍如何将历史数据迁移到腾讯云万象优图

1 历史数据迁移

在使用万象优图以前,您的图片数据可能存在服务器本地文件系统分布式文件系统以及其他云存储等,我们提供迁移工具,方便您将这些历史图片迁移到万象,目前支持3种存储方式的迁移:

  1. 图片在服务器本地存储,直接将某目录下的所有文件上传到万象优图。
  2. 指定URL列表文件,文件中每一行是一张图片的URL。工具会下载列表文件中的每一张图片并上传到万象优图。
  3. 指定七牛云存储的账号和空间名,迁移该指定空间中的所有文件或部分文件到万象优图。

本工具目前支持类Unix操作系统。推荐在Linux或Mac OS X下使用Python 2.7运行。

1.1 迁移工具下载地址

https://github.com/tencentyun/Cloud-Image-Migration-Tool

1.2 迁移工具安装使用方法

从github上通过git获取,或者下载压缩包解压到linux服务器上,然后进入工具目录

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd Cloud-Image-Migration-Tool/bin

1.2.1 启动迁移

运行start.sh脚本,工具会按照配置文件中的配置开始运行.启动前请修改配置,否则会运行失败。如果要迁移的文件较多,可后台运行,运行命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
./start.sh &

上传完成后再次运行start.sh会重试失败的任务。

start.sh脚本首先扫描待上传的任务提交到任务列表,然后开始上传。如果第一个过程被打断,下次运行start.sh会重新扫描待上传的任务;如果第二个过程被打断,下次运行start.sh会继续上传。如果需要强制刷新任务列表请运行以下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
./start.sh -f &

1.2.2 查看迁移进度

启动后可查看迁移状态,运行stat.sh脚本,会在屏幕上持续输出迁移状态,按Ctrl+c退出查看。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
./stat.sh

该脚本输出内容如下图:

数字有三列,第一列:失败的文件数;第二列:成功迁移的文件数;第三列:要迁移的文件总数

1.2.3 停止迁移

若启动后想做配置调整或任何异常发生,可停止迁移,运行stop.sh。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
./stop.sh

在迁移过程中运行stop.sh脚本停止迁移,这一过程可能需要等待几秒钟的时间以保证已经开始的任务正常结束并写入日志。如果需要强制停止,运行stop.sh -f。

停止迁移之后如果没有清空日志并且没有修改配置信息,再次启动迁移会继续上次的迁移任务,重试所有失败记录但已经迁移成功的文件不会重传。

1.2.4 获取失败信息

获取迁移失败的文件列表及信息,运行view_failed.sh。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
./view_failed.sh

1.2.5 清除日志

若想开始一次新迁移,可清空之前的日志信息,运行clean.sh。请慎用,因为日志文件会作为增量断点续传的参考信息,删除后再执行相同任务所有文件会重新上传。

1.3 修改配置

配置文件为config.ini位于conf目录, 配置文件中section name和option name不区分大小写。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
vi Cloud-Image-Migration-Tool/conf/config.ini

1.3.1 迁移类型设置

设置migrate.type 为

Local 表示迁移linux本地文件系统的文件 URLList 表示迁移url列表文件中所有url指向的文件 Qiniu 表示迁移七牛某空间的文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[MigrateInfo]
migrate.type = Local

1.3.1.1 本地文件系统

若迁移类型为Local,则需要配置上传的本地根目录位置,必须为绝对路径。上传后的file id不包含根目录。例如:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[Local]
local.image_root_path = /root/data/images/

迁移后图片的访问路径:

http: //上传的万象空间域名/图片相对于所配置的根目录的相对路径

比如,设置的本地目录:/data/web/images 有一张图片路径为:/data/web/images/2015/07/17/abc.jpg,上传后访问路径:http: //上传的万象空间域名/2015/07/17/abc.jpg

1.3.2 URL列表文件

若迁移类型为URLList,则需要配置URL列表文件的位置,必须为绝对路径。例如:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[URLList]
url.url_list_file_path = /data/url_list

迁移后图片的访问路径:

http: //上传的万象空间域名/原url的url路径

比如,原url为http: //www .xxx.yyy .com/2015/07/17/abc.jpg,上传后访问路径:http: //上传的万象空间域名/2015/07/17/abc.jpg

注意:若原url中有参数,上传后的文件名是去掉参数后的,比如,原url为http:// www .xxx. yyy. com/2015/07/17/abc.jpg?width=1024&height=1024,上传后访问路径:http: //上传的万象空间域名/2015/07/17/abc.jpg

1.3.3 七牛

若迁移类型为Qiniu,则需要配置七牛云存储账号相关信息。

qiniu.bucket填写被迁移的空间名;qiniu.domain为七牛域名,需要包含协议类型(如http:// ); 若只迁移一部分则需要提供qiniu.start_offset和qiniu.total_num,qiniu.start_offset从0计;若空间开启了防盗链,需要在qiniu.referer中指定访问来源域名,同样需要包含协议类型(如http:// ); 如果是私有空间,将qiniu.isprivate设置为True,否则设置为False。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[Qiniu]
[Qiniu]
qiniu.bucket = my_bucket_name
qiniu.AccessKey = _17terLxP-ZK7tma9jXgm7MuEOk72yP9OZBIP35G
qiniu.SecretKey = PFw6JivhTAdNKRojaguUkC6tlFHAI9SBrjVYdfya
qiniu.domain = http://abcde.com1.fg.glb.clouddn.com/
qiniu.referer = 
qiniu.isprivate = False

迁移后图片的访问路径:

http: //上传的万象空间域名/原七牛key

比如,原图片下载路径为http:// 7x3m4e .com 1.z0.glb.clouddn.com /2015/07/17/abc.jpg, 上传后访问路径:http: //上传的万象空间域名/2015/07/17/abc.jpg

1.3.4 万象优图账号信息

从万象优图图片空间中查看项目ID和空间名称,分别填写到appinfo.appid和appinfo.bucket;

从万象优图项目设置中查看Secret ID和Secret Key分别填写到appinfo.secretID和appinfo.secretKey。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[AppInfo]
appinfo.appid = 
appinfo.secretID = 
appinfo.secretKey = 
appinfo.bucket =

1.3.5 上传设置

Concurrency控制同时运行的上传进程数目,请根据上行带宽和机器配置适当调整该数值。必须提供一个大于0的整数。

db.commit.interval控制上传结果写回日志的时间间隔,单位为秒,应该提供一个合法的正整数或浮点数或正无穷(inf)。如果进程意外结束,未写回的日志将丢失。此值设置过小将严重影响性能,一般情况下使用默认值即可。

jobqueue.capacity、jobqueue.reload.threshold、buffer.size是控制任务队列和内存缓冲区的选项,一般情况下使用默认值即可。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[ToolConfig]
concurrency = 10
jobqueue.capacity = 2000
jobqueue.reload.threshold = 0.4
buffer.size = 100000
db.commit.interval = 3

fileid.ignore.if使工具在提交任务时忽略file id符合指定条件的任务。

fileid.ignore.unless使工具在提交任务时忽略file id不符合指定条件的任务。

error.ignore.if使工具在重试出错任务时忽略错误日志符合指定条件的任务。

以上三个选项若启用则应提供一个正则表达式,否则留空,语法参考Python re Module Reference。如果同时提供了fileid.ignore.if和fileid.ignore.unless,并且某个file id同时符合两个正则表达式,那么它会被忽略。

如忽略OS X操作系统下的.DS_Store文件,不重试错误码为-1886的任务:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[Advanced]
fileid.ignore.if = .*.DS_Store
fileid.ignore.unless = 
error.ignore.if = .*code: -1886.*

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
1 条评论
热度
最新
回头试试看
回头试试看
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
智能云上手指南:如何使用万象优图服务的 Python SDK
6 月 21 日,腾讯云在 2017「云+未来」峰会上推出了战略新品——智能云,宣布将腾讯积累近 20 年的 AI 能力向政府、企业和开发者开放,其中首批开放计算机视觉、智能语音识别、自然语言处理的三
腾讯云开发者社区
2017/06/21
2.7K0
使用腾讯云 CDN 、COS 以及万象优图实现HTTP/2样例
本文主要介绍了HTTP/2对比HTTP/1.1在性能上的突出优势,通过支持请求与响应的多路复用来达到低延迟的效果,同时实现了一个在线的对比样例,并具体介绍了使用腾讯云CDN,COS,以及万象优图搭建这个样例的过程。如果你的网站还没使用HTTP/2,赶快来试一试吧!
腾讯云CDN团队
2017/05/15
6.5K0
数据万象盲水印功能介绍
盲水印功能是腾讯云万象优图提供的全新水印模式。通过该功能,您可将水印图以不可见的形式添加到原图信息中,并不会对原图质量产生太大影响。在图片被盗取后,您可对疑似被盗取的资源进行盲水印提取,验证图片归属。
用户4693941
2019/02/22
3.2K0
借助数据万象(原万象优图),让 hexo 也用上 webp
我的博客目前是使用 hexo + Next 主题搭建在 GitHub Pages 上的,使用 git 管理,并接入了 Travis-CI 自动发布。一直以来,对于图片的处理是我的一块心病。虽然hexo官方提出了资源文件夹的概念,但是{% asset_img example.jpg This is an example image %}这种方式几乎不被任何 Markdown 编辑器支持。
edsion
2019/07/28
2.4K0
借助数据万象(原万象优图),让 hexo 也用上 webp
微信小程序基于万象优图实现图片 OCR
Jason
2017/12/18
12.1K5
微信小程序基于万象优图实现图片 OCR
微信云开发环境里可以调用万象优图接口处理图片
微信小程序里自己处理图片写起来比较麻烦,一些标准的可以参数化的处理如果能调用万象优图来处理就轻松多了。虽然微信云开发的“云存储”从腾讯云COS里面看不到相应的桶,但它背后其实还是一个COS桶,所以只要给文件生成临时访问路径,万象优图的api也可以直接在微信云开发里面调用,像这样:
黄希彤
2021/11/05
9780
如何实现客户对象存储数据迁移到腾讯云COS
在云计算客户的拓展过程中,会面临客户的各种需求。其中最常见的需求包括,如何在云计算上构建客户的业务系统,搭建基础架构;另外一个就是如何实现客户数据的高效存储,包括存储新产生的用户数据,以及将现有的用户数据平滑迁移到云计算上来,提供更方便,更快捷的访问。
张小波
2018/10/24
4.6K0
用数据万象转换图片格式!超全的格式一键转换
你是否曾对如何预览 PSD、RAW 等奇奇怪怪的图片格式感到束手无策?是否在相机原生格式预览等场景中遭遇难题?
云存储
2024/08/29
3320
用数据万象转换图片格式!超全的格式一键转换
数据万象盲水印添加和提取
官方文档:https://cloud.tencent.com/document/product/460/19017#.E6.8F.90.E5.8F.96.E7.9B.B2.E6.B0.B4.E5.8D.B0
爆龙战士
2020/12/02
1.5K0
七牛对象存储的使用
Jekyll个人网页是个好技术,github.com是个好网站,不过存储容量和流量的限制是个头痛的事情,当然,也在情理之中。 好在我们生于“云”的时代,有很多办法来扩展我们的世界。在引用图片方面,主要的要求就是服务商可以提供外链。由于在国内,我们的选择少了一些,不过还是有几个优选的: 百度图片,网址是https://timgsa.baidu.com,图片可以外链,缺点是路径太长,在Markdown源文件中看起来很丑也难操作。另外图片来源主要靠搜索,难以表达自己的精确要求。 新浪图片,在微博中上传的图片
俺踏月色而来
2018/06/20
2K0
智能云上手指南:如何使用腾讯云开放的图片鉴黄能力?
本文介绍了如何使用腾讯云开放的图片鉴黄能力,通过接入腾讯云万象优图CI服务,开发者可以在短时间内体验到先进的AI技术。只需几行代码,即可识别图片中是否包含色情、暴力等违禁内容。同时,文章还详细介绍了如何使用该服务,并提供了相关示例代码。
腾讯云开发者社区
2017/06/21
5.9K0
智能云上手指南:如何使用腾讯云开放的图片鉴黄能力?
智能云上手指南:如何接入腾讯云开放的计算机视觉能力?
腾讯云开发者社区
2017/06/21
3K0
利用腾讯云数据万象节省带宽,极致压缩图片
目前我的博客使用Typecho + VOID(主题)部署在GCP香港上,访问速度不能说很慢,但是移动全线路绕美个人体验很差。之前直接套了nodecache的香港CDN,反而变成了减速器,之后又安装了魔改版BBR,腾讯TCPA加速80,443,图片懒加载并上传到腾讯云cos用国内CDN加速,但是总体速度依旧不尽人意。直接压缩成WebP并不是所有浏览器都支持,不支持的浏览器直接不显示图片,所以要让支持的浏览器加载WebP格式,不持支的浏览器加载原格式。
jcjyxjs
2021/09/09
2.4K0
利用腾讯云数据万象节省带宽,极致压缩图片
【玩转腾讯云】腾讯云对象存储COS + 数据万象CI = 完善的图片解决方案
在日常开发当中,我们必然会遇到一些图片存储问题,例如用户头像、聊天发生的图片等,而这些图片资源存储是个问题,普遍做法都是直接落在服务器上进行存储,而我推荐的是图片资源的存储直接上云使用云存储,本地可以保留备份,读取数据走云存储,同时可以增加CDN等。
沈唁
2020/03/27
8.8K11
【玩转腾讯云】腾讯云对象存储COS + 数据万象CI = 完善的图片解决方案
【腾讯云的1001种玩法】 Laravel 整合万向优图图片管理能力,打造高效图片处理服务
什么是万象优图 万象优图是腾讯云为开发者提供图片智能鉴黄、图片内容识别、人脸识别、OCR识别等服务;也可以根据需求提供定制化的图片识别服务;同时也提供灵活的图像编辑服务,如裁剪、压缩,水印等,满足您的
白宦成
2017/02/28
4.9K0
如何用腾讯云打造一款微视频 APP
该文介绍了如何利用腾讯云对象存储服务实现音视频文件的上传、下载和管理。通过创建存储空间、上传音视频文件、管理文件访问权限等操作,使用户能够便捷地使用云存储服务。同时,文章还讲解了如何为音视频文件添加水印和实现下载配额限制等功能。最后,文章分享了一些实践经验,帮助用户在实际应用中遇到问题时能够快速解决。
云加创业小助手
2016/11/03
4.9K0
如何用腾讯云打造一款微视频 APP
如何将本地数迁移至腾讯云之一工具篇 - COS Migration
COS Migration 是一个集成了 COS 数据迁移功能的一体化工具。通过简单的配置操作,用户可以将源地址数据快速迁移至 COS 中,它具有以下特点:
云存储
2019/11/28
2.2K0
如何将本地数迁移至腾讯云之一工具篇 - COS Migration
《数据万象带你玩转视图场景》第一期:avif图片压缩详解
随着硬件的发展,不管是手机还是专业摄像设备拍出的图片随便可能就有几M,甚至几十M,并且现在我们处于随处可及的信息海洋里,海量的图片带来了存储问题、带宽问题、加载时延问题等等。对图片信息进行有效的压缩处理无疑会极大的降低存储成本、流量压力,并且还能显著提升页面加载速度。
jimmy老师
2023/03/06
7610
《数据万象带你玩转视图场景》第一期:avif图片压缩详解
博客图床迁移记
前几天在群里看到说新浪微博图床挂掉了,图床上的图片链接单独访问还可以,但是在博客文章上就显示不出来了。
音视频开发进阶
2019/06/03
1.3K0
IDC、友商云数据上云(COS)最佳实践
本文从通用的数据上云场景,以及友商云数据迁移场景出发,介绍基于腾讯云对象存储(COS)的上云步骤,包括迁移前的环境准备工作,云上的配置与迁移工具的实施,数据的一致性校验,云上业务的切换与验证。
wainsun
2021/08/18
2.3K0
IDC、友商云数据上云(COS)最佳实践
推荐阅读
相关推荐
智能云上手指南:如何使用万象优图服务的 Python SDK
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验