是否可以将此 Python 代码翻译成 Cython？

2023年4月6日上午8:26 • Python开发

【问题标题】：Is it possible to translate this Python code to Cython?是否可以将此 Python 代码翻译成 Cython？
【发布时间】：2023-04-06 01:23:01
【问题描述】：

我实际上希望尽可能加快此代码的#2，所以我认为尝试 Cython 可能会很有用。但是，我不确定如何在 Cython 中实现稀疏矩阵。有人可以展示如何/是否可以将其包装在 Cython 或 Julia 中以使其更快？

#1) This part computes u_dict dictionary filled with unique strings and then enumerates them.

import scipy.sparse as sp
import numpy as np
from scipy.sparse import csr_matrix

full_dict = set(train1.values.ravel().tolist() + test1.values.ravel().tolist() + train2.values.ravel().tolist() + test2.values.ravel().tolist())
print len(full_dict)
u_dict= dict()
for i, q in enumerate(full_dict):
    u_dict[q] = i


shape = (len(full_dict), len(full_dict))
H = sp.lil_matrix(shape, dtype=np.int8)


def load_sparse_csr(filename):
    loader = np.load(filename)
    return csr_matrix((loader['data'], loader['indices'], loader['indptr']),
                      shape=loader['shape'])

#2) I need to speed up this part
# train_full is pandas dataframe with two columns w1 and w2 filled with strings

H = load_sparse_csr('matrix.npz')

correlation_train = []
for idx, row in train_full.iterrows():
    if idx%1000 == 0: print idx
    id_1 = u_dict[row['w1']]
    id_2 = u_dict[row['w2']]
    a_vec = H[id_1].toarray() # these vectors are of length of < 3 mil.
    b_vec = H[id_2].toarray()
    correlation_train.append(np.corrcoef(a_vec, b_vec)[0][1])

【问题讨论】：

见this question。

标签：
python
pandas
numpy
scipy
cython

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：是否可以将此 Python 代码翻译成 Cython？ - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

为什么我的多进程 Python 脚本永远不会结束？

上一篇 2023年4月6日

Python – Kivy 框架 – Spinner 值列表

下一篇 2023年4月6日

教大家玩转Python字符串处理的七种技巧

下面是详细讲解“教大家玩转Python字符串处理的七种技巧”的完整攻略，共包含七个部分。一、去除字符串两端的空格要去除字符串两端的空格，可以使用Python内置函数strip()。该函数可以去除字符串两端的空格，也可以去除字符串两端特定字符，默认去除空格。示例代码： str1 = " Python " print(str1.stri…

python 2023年6月5日
000
Python os模块学习笔记

Python中的os模块提供了与操作系统交互的接口，它可以访问操作系统的文件系统、进程、环境变量等功能。本篇文章将详细介绍Python os模块的使用方法，并提供两个示例说明。 1. os模块的常用函数 os模块提供了大量的函数和常量，下面是其中一些常用的函数： 1.1 文件和目录操作 os.getcwd()：获取当前工作目录。 os.listdir(pat…

python 2023年5月30日
000
Python爬虫回测股票的实例讲解

下面我将详细讲解“Python爬虫回测股票的实例讲解”的完整攻略。标题一：爬虫技术的重要性在进行股票投资时，获取股票相关信息非常重要，数据获取的来源就需要借助爬虫技术。在讲解具体内容之前，需要先介绍爬虫技术及其重要性。标题二：Python爬虫技术的应用针对股票信息的爬虫，Python是非常常用的编程语言之一。在爬虫技术上，Python有着更简洁的代码…

python 2023年6月3日
000
Mysql DateTime 查询问题解析

下面是详细的MySQL DateTime查询问题解析的实例教程。什么是DateTime DateTime是MySQL的一个时间格式，表示时间戳。在MySQL中，与时间相关的数据类型有多种，如DATE、TIME、DATETIME、TIMESTAMP等，而DateTime则是其中的一种常用类型。 DateTime的格式为：YYYY-MM-DD HH:MM:SS…

python 2023年5月13日
000
Python使用urllib模块的urlopen超时问题解决方法

什么是urlopen超时问题在使用Python中的urllib模块的urlopen方法打开URL链接时，如果服务器响应时间超过默认的超时时间，那么该方法将会一直阻塞等待直到服务器响应完成，这就是urlopen的超时问题。 urlopen超时问题的解决方法为了解决这个问题，可以使用以下两种方法： 2.1. 设置超时时间参数在调用urlopen方法时，可以…

python 2023年6月3日
000
如何使用 SWIG 在 C++ 中调用 python 函数？

【问题标题】：How do I call a python function in C++ using SWIG?如何使用 SWIG 在 C++ 中调用 python 函数？【发布时间】：2023-04-07 17:47:01 【问题描述】：我有一个如下C++ class myfun{ public: virtual double eval(arma::…

Python开发 2023年4月8日
000
基于Python 的语音重采样函数解析

基于Python 的语音重采样函数解析什么是语音重采样？语音重采样是一种改变语音采样率的技术，可以降低或提高语音文件的采样率，用于修改语音的频率、音高、音调等特征。重采样函数 resample Python语音信号处理库中，Scipy模块提供了一个简便的语音重采样函数，名为 resample 。函数介绍 resample 用于将语音的采样率从原始值改…

python 2023年5月19日
000
简单实现python爬虫功能

要实现Python爬虫功能，可以参考以下步骤： 1. 确定目标网站和需求首先需要确定要爬取的网站和需要获取的数据类型，比如新闻信息、商品价格等。在确定目标和需求后，可以开始编写代码。 2. 安装所需模块可利用pip命令安装所需模块，比如requests、bs4、urllib等。例如，安装requests模块： pip install requests 3…

python 2023年5月14日
000

合作推广

合作推广

返回顶部