Skip to content

Latest commit

 

History

History
532 lines (483 loc) · 15.1 KB

README.md

File metadata and controls

532 lines (483 loc) · 15.1 KB

star fork

中文 | English



视频培训课程: 制作中......

  • 相关源码
  • 技术答疑

培训课程系列1. 基础篇

    1. JavaCV - java版的OpenCV实现传统图像处理(提供常用代码例子)
    1. NDArray - java版的numpy,用于高性能处理矩阵(提供常用代码例子)

培训课程系列2. 算法篇

    1. 深度学习算法基础
    • 基础知识:前馈神经网络,卷积神经网络,循环神经网络
    • 图像识别:图像分类,图像分割,目标检测
    1. java版的模型开发与训练
    1. pytorch 模型开发与训练

培训课程系列3. 应用篇 - JavaAI实战系列

    1. 图像处理_SDK(培训常用图像处理,并提供可商用的源码)
    • 人脸工具箱
    • 人脸高清修复
    • 图文高清_黑白上色
    1. NLP_SDK(培训常用自然语言处理,并提供可商用的源码)
    • 代码特征向量提取
    • 中文特征向量提取
    • 多语言文本特征向量提取
    • 机器翻译
    1. Web应用(培训如何开发web类应用,并提供可商用的源码)
    • OCR,OCR自定义模版
    • 人脸搜索
    • 以图搜图
    • 图像文本跨模态搜索
    • 文本搜索
    • 代码语义搜索
    • 一键抠图
    • 图像高清
    • 机器翻译
    1. AIGC 图像生成(培训如何开发图像生成类应用,并提供可商用的源码)
    • AIGC提示词如何撰写
    • 图像生成预处理
    • 图像生成SD工具箱
    • 模型微调(LoRA)
    1. AI桌面应用开发(培训如何开发桌面应用,并提供可商用的源码)
    • 大模型桌面应用
    • OCR桌面应用
    • 图像高清放大
    1. 大模型
    • 大模型算法原理(transformer,训练,微调,推理优化)
    • 知识库,RAG增强生成等
    • 提示词工程

项目清单:

  • 6_web_app - [Web应用,前端VUE,后端Springboot]
  1). 训练引擎
  2). 语音识别
  3). OCR Web应用
      ...

AI 训练平台
- training

AI训练平台提供分类模型训练能力。
并以REST API形式为上层应用提供接口。

语音识别Web 应用
- asr

- 英文语音识别,
- 中文语音识别。

OCR Web 应用
- ocr_web_app

- 自由文本识别(支持旋转、倾斜的图片)
- 文本图片转正 (一般情况下不需要,因为ocr 原生支持旋转、倾斜的图片 )
- 表格文本识别(图片需是剪切好的单表格图片)
- 表格自动检测文本识别(支持表格文字混编,自动检测表格识别文字,支持多表格)
  • 1_image_sdks - [图像识别 SDK]
  1). 工具箱系列:图像处理工具箱(静态图像)
  2). 目标检测
  3). 图像分割
  4). GAN
  5). 其它类别:OCR等
      ...

OCR工具箱 1:方向检测

- ocr_sdks/
ocr_direction_det_sdk
- OCR图像预处理。

OCR工具箱 2:OCR文字识别

1. ocr_sdks/ocr_v3_sdk
1). V3 文本检测:
- 中文文本检测
- 英文文本检测
- 多语言文本检测
2). V3 文本识别:
- 中文简体
- 中文繁体
- 英文
- 韩语
- 日语
- 阿拉伯
- 梵文
- 泰米尔语
- 泰卢固语
- 卡纳达文
- 斯拉夫
2. ocr_sdks/ocr_v4_sdk
- 原生支持倾斜文本文字识别。
- 更高的识别精度
- 支持中英文。

OCR工具箱 4:版面分析

- ocr_sdks/ocr_layout_sdk
可以用于配合文字识别,
表格识别的流水线处理使用。
1). 中文版面分析
2). 英文版面分析
3). 中英文文档 - 表格区域检测

OCR工具箱 5: 表格识别

- ocr_sdks/ocr_table_sdk
- 中英文表格识别。

动物分类识别
- classification/animal_sdk

动物识别sdk,支持7978种动物的分类识别。

菜品分类识别
- classification/dish_sdk

菜品识别sdk,支持8416种菜品的分类识别。

烟火检测
- fire_smoke_sdk

烟火检测,给出检测框和置信度。

行人检测
- pedestrian_sdk

行人检测,给出检测框和置信度。

智慧工地检测
- smart_construction_sdk

支持检测的类别:人体,安全帽。

车辆检测
- vehicle_sdk

车辆检测,给出检测框和置信度。
  • 2_nlp_sdks - [自然语言 SDK]
  1). 工具箱系列:sentencepiece,fastText,npy/npz文件处理等。
  2). 大模型
  3). 词向量
  4). 机器翻译
      ...

Sentencepiece分词
- kits/sentencepiece_sdk

Sentencepiece分词的Java实现。

jieba分词
- lexical_analysis/jieba_sdk

jieba分词java版本的简化实现。
  • 3_audio_sdks - [语音处理 SDK]
  1). 工具箱系列:音素工具箱,librosa,java sound,javacv ffmpeg, fft, vad工具箱等。
  2). 声音克隆
  3). 语音合成
  4). 声纹识别
  5). 语音识别
      ...

中文语音识别(ASR)

1. 短语音
- asr_whisper_sdk
2. 长语音
- asr_whisper_long_sdk

TTS 文本转为语音

- tts_sdk
- TTS 文本转为语音。
  • 4_video_sdks - [视频解析SDK]
  1). 摄像头口罩检测 - camera_facemask_sdk
  2). MP4检测口罩 - mp4_facemask_sdk
  3). rtsp取流检测口罩 - rtsp_facemask_sdk

视频流分析

1. 摄像头口罩检测
- camera_facemask_sdk
2. MP4检测口罩
- mp4_facemask_sdk
3. rtsp取流检测口罩
- rtsp_facemask_sdk
  • 5_bigdata_sdks - [大数据SDK]
  1). flink-情感倾向分析【英文】- flink_sentence_encoder_sdk
  2). kafka-情感倾向分析【英文】- kafka_sentiment_analysis_sdk
      ...

大数据分析

flink-情感倾向分析
flink_sentiment_analysis_sdk
kafka-情感倾向分析
kafka_sentiment_analysis_sdk
针对带有主观描述的文本,
可自动判断该文本的情感极性类别并给出相应的置信度。

1. 官网:

####1.1 联系方式:

####1.2 开源地址:

其它研究专题:

1). AI + 量子计算

2). AI + 生物医药