Python 是一门简单易学却功能非常强大的语言。好玩实用的工具层出不穷,也给我们的工作生活带来极大的方便。在之前文章中我已多次分享过一些实用的工具,有兴趣的可以翻阅一下,今天我再分享 5 款非常使用的工具:

  • Lux
  • Translators
  • TextShot
  • Fancy-NLP
  • latexify_py
原文链接:效率倍增!5款超级好用的Python工具库!
1、Lux

Lux 是一个 Python 库,它可以自动化的进行数据探索,让你能更轻松的玩转数据科学。Lux 旨在与 Pandas 紧密集成,可以按原样使用,而无需修改您现有的Pandas代码。要启用Lux,只需将 import lux 与 Pandas import 语句一起添加即可。

import lux
import pandas as pd

瞧!这是一组可视化,你还可以在 Lux 中指定您感兴趣的属性和值。基于此意图,Lux会指导用户朝着潜在的下一步发展,当然还有很多功能,有兴趣可以进一步探索。
在这里插入图片描述

官方链接

https://lux-api.readthedocs.io/en/latest/source/getting_started/installation.html
df.intent = ["AverageCost","SATAverage"]
df
安装方法
# PyPI安装Python Lux API
pip install lux-api
#要安装小部件,我们需要安装webpack
npm install --save-dev webpack webpack-cli
# npm安装Lux Jupyter小部件
npm i lux-widget
2、Translators

Translators 集成了谷歌、必应、有道、百度等多个翻译平台 API,支持上百种语言翻译,使用便捷,配置灵活。对于批量需要翻译的场景,绝对是提效利器。

安装

# Windows, Mac, Linux
pip install translators --upgrade

# Linux javascript runtime environment:
sudo yum -y install nodejs

示例展示

import translators as ts

wyw_text = '季姬寂,集鸡,鸡即棘鸡。棘鸡饥叽,季姬及箕稷济鸡。'
chs_text = '季姬感到寂寞,罗集了一些鸡来养,鸡是那种出自荆棘丛中的野鸡。野鸡饿了唧唧叫,季姬就拿竹箕中的谷物喂鸡。'
# input languages
print(ts.deepl(wyw_text)) # default: from_language='auto', to_language='en'
## output language_map
print(ts._deepl.language_map)
# professional field
print(ts.baidu(wyw_text, professional_field='common')) # ('common','medicine','electronics','mechanics')
# requests
print(ts.youdao(wyw_text, sleep_seconds=5, proxies={}, use_cache=True))
# host service
print(ts.google(wyw_text, if_use_cn_host=True))
print(ts.bing(wyw_text, if_use_cn_host=False))

Github 官方链接

https://github.com/UlionTse/translators
3、TextShot

推荐一款高精度免费 OCR 工具:TextShot。开发这款工具仅仅使用 139 行 Python 代码完成,就可快速提取截屏文本内容并复制到剪贴板。且适用于 Windows,macOS 和 Linux 系统。
在这里插入图片描述

4、Fancy-NLP

Fancy-NLP 是由腾讯商品广告策略组团队构建的用于建设商品画像的文本知识挖掘工具,其支持诸如实体提取、文本分类和文本相似度匹配等多种常见 NLP 任务。与当前业界常用框架相比,其能够支持用户进行快速的功能实现。

在当前的商品广告业务场景中,我们利用该工具快速挖掘海量商品数据的特征,从而支持广告商品推荐等模块中。

安装方式

pip install fancy-nlp

示例代码

输出文本中的实体信息

from fancy_nlp.applications import NER
ner_app = NER()
ner_app.analyze('同济大学位于上海市杨浦区,校长为陈杰')

结果产出

{'text': '同济大学位于上海市杨浦区,校长为陈杰',
 'entities': [
  {'name': '同济大学',
   'type': 'ORG',
   'score': 1.0,
   'beginOffset': 0,
   'endOffset': 4},
  {'name': '上海市',
   'type': 'LOC',
   'score': 1.0,
   'beginOffset': 6,
   'endOffset': 9},
  {'name': '杨浦区',
   'type': 'LOC',
   'score': 1.0,
   'beginOffset': 9,
   'endOffset': 12},
  {'name': '陈杰',
   'type': 'PER',
   'score': 1.0,
   'beginOffset': 16,
   'endOffset': 18}]}

此外还可以进行文本类别识别、文本意图识别,测试后效果真的不错噢

Github 官方链接

https://github.com/boat-group/fancy-nlp
5、latexify_py

latexify_py,可快速将 Python 函数快速转为 LaTeX 数学公式。对于有公式需要处理的小伙伴,绝对是福利!作者是 Google Brain 的软件工程师 Yusuke Oda,目前主要负责自然语言处理,语音处理,软件工程和机器学习等工程。

Github 官方链接

https://github.com/google/latexify_py

技术交流

欢迎转载、收藏本文,码字不易,有所收获点赞支持一下!

为方便进行学习交流,本号开通了技术交流群,添加方式如下:

直接添加小助手微信号:pythoner666,备注:CSDN+python,或者按照如下方式添加均可!
在这里插入图片描述

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐