neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统

2023年4月6日上午12:23 • 卷积神经网络

上周看到韩松毕业论文，扯出神经网络加速器EIE，刚好这周调研了一下neuFlow，扯出09年的一篇做卷积加速的文章，大牛Lecun Yan的学生做的，一晃眼，快十年了。也记录之。

这一套还没研究透，又被换了方向，只好抽出一个晚饭时间，把看懂的记下来，不懂的暂时不研究了，如果以后再被拎回来搞这个方向再看吧。

1. neuFlow的整体思想：

CNP是09年的一个卷积加速器，newFlow是12年的一个神经计算芯片，并加上了luaFlow编译器做成了一个嵌入式系统，可以实现人脸识别、场景分割等等。

大概思想如图，先训练好一个卷积神经网络模型，用luaFlow编译成neuFlow能跑的机器码，跟硬件代码一起下载到FPGA或者流片成ASIC，运行。

neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统

2.CNP架构

neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统

CPU使用32位的Power PC，VALU是计算加速单元，作者为这个模块设计了四种微指令：2D卷积、2D空间池化与下采样、点积、非线性（sigmoid或者tanh之类）

根据微指令功能，CNP赤裸裸的面向卷积神经网路计算。（Lecun的学生做的）

3. 2D卷积加速器设计

3*3卷积加速器设计方案：

neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统

计算流程如下：

neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统

neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统

neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：neuFlow&CNP-卷积计算加速器&神经网络加速芯片生态系统 - Python技术站

人工智能卷积神经网络

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

卷积层设置及输出大小计算

上一篇 2023年4月6日上午12:23

TensorFlow卷积神经网络实现手写数字识别以及可视化

下一篇 2023年4月6日

pytorch中的pack_padded_sequence和pad_packed_sequence用法

pack_padded_sequence是将句子按照batch优先的原则记录每个句子的词，变化为不定长tensor，方便计算损失函数。 pad_packed_sequence是将pack_padded_sequence生成的结构转化为原先的结构，定长的tensor。其中test.txt的内容 As they sat in a nice coffee sho…

PyTorch 2023年4月7日
000
tensorflow

tensorflow softmax_cross_entropy_with_logits函数

1、softmax_cross_entropy_with_logits tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None) 解释：这个函数的作用是计算 logits 经 softmax 函数激活之后的交叉熵。对于每个独立的分类任务，这个函数是去度量概率误差。比如，在 CIFA…

2023年4月5日
000
Caffe

NVIDIA DIGITS 学习笔记（NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0） – 艾斯1213

NVIDIA DIGITS 学习笔记（NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0） NVIDIA DIGITS 学习笔记（NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0…

2023年4月8日
000
PyTorch

如何入门Pytorch之一：Pytorch基本知识介绍

前言 PyTorch和Tensorflow是目前最为火热的两大深度学习框架，Tensorflow主要用户群在于工业界，而PyTorch主要用户分布在学术界。目前视觉三大顶会的论文大多都是基于PyTorch，如何快速入门PyTorch成了当务之急。正文本着循序渐进的原则，我会依次从易到难的内容进行介绍，并采用定期更新的方式来补充该…

2023年4月6日
000
PyTorch

pytorch中如何在lstm中输入可变长的序列

PyTorch 训练 RNN 时，序列长度不固定怎么办？ pytorch中如何在lstm中输入可变长的序列上面两篇文章写得很好，把LSTM中训练变长序列所需的三个函数讲解的很清晰，但是这两篇文章没有给出完整的训练代码，并且没有写关于带label的情况，为此，本文给出一个完整的带label的训练代码： import torch from torch impo…

2023年4月7日
000
新转移注意(caffe):ImportError: libcudart.so.7.0: cannot open shared object file: No such file or directory

https://github.com/NVIDIA/DIGITS/issues/8 For this errorImportError: libcudart.so.7.0: cannot open shared object file: No such file or directory I have executed this command to sol…

Caffe 2023年4月8日
000
统计学习（统计机器）方法概论

根据李航老师所著《统计学习方法》为线，结合其他书籍和网上资料，开始对机器学习进行系统整理。 2018.12.30：今日开始对写过的内容进行修改和细化补充，主要参考周志华教授的《机器学习》，辅以各大网友的不吝赐教。统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。 1、特点：(1)以计算机和网络为平台；(2)以数据为研…

机器学习 2023年4月10日
000
pytorch 数据拼接与拆分cat、stack、split、chunck

1、cat拼接功能：通过dim指定维度，在当前指定维度上直接拼接默认是dim=0 指定的dim上，维度可以不相同，其他dim上维度必须相同，不然会报错。 1）拼接两个维度相同的数 a = torch.rand(2, 3, 2) a # 输出： tensor([[[0.6072, 0.6531], [0.2023, 0.2506], [0.0590, 0.…

PyTorch 2023年4月8日
000

合作推广

合作推广

返回顶部