TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)
这是AI大智慧系列文章中的一篇关于图片转文字的一篇博文,介绍了如果使用已经训练好的模型。由于本模型的训练非常耗时间,GPU下可能需要 2weeks ,如果是浦东(普通)的笔记本,天呢,估计需要一年的时间(当然夸张了,一个月的时间还是需要的,根据美国team看 需要的时间大约是gup 时间的 10倍,也就是 20 weeks ,小半年时间了) 。
外界 ,至少我本人曾经以为AI能够处理的信息应该是巨大的,整理完这个模型的使用方法和模型本身内部的结构(解剖)就在内心充满了失望,悲剧的感情在整个身体流淌 。因为AI确实什么事情都干不了,恐怕这个时间要持续五年,十年,五十年 甚至更久远。单纯就从计算机技术来讲,区块链在上面提到的时间内更具有核弹威力 ,更通俗下讲就是更容易make money ,也更容易出成绩 。跟金融,财务 税收 ,发票 ,更简单的讲 跟fund or money 有关的领域 到可以用blockchin 。
找不到生活的方向,也找不到人生的意义,我抑郁。
先说明下 什么是图片转文字 ,道理非常简单 ,就是 根据图片上的信息 ,有算法 把该信息 提炼出来 转成文字 打印到平台上,如果是有能力做成小程序的话 ,也许意义会变的大一点,可是目前不具备这个能力 哼哼 抑郁
先上代码 code 地址 : https://github.com/haohaixingyun/im2txt-ethan-tensorflow
在本次实验中用到的 工具版本如下,
Python 3.6.2
TF : 1.3.0 ,更高版本1.10.0尝试过也是可以的 。
拿到code 和配置完成环境变量后 直接run run_inference.py 这个script 就 能够得到你想的结果 。
由于训练样本选择的原因 ,让本模型去识别一些不登大雅之堂的图片是办不到的 。在家里的laptop 上试验过 。其中一个重要的原因是本模型根本就没有哪些个特殊的单词 或是描述 。
上面的图片预测出来是:
基本上搞不懂预测的是什么 ,不过好在是一个女孩 做在bed 上是可以明白的,泰迪熊是怎么来的 ,不知道
the good result :
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt) - Python技术站