44 lines
1.4 KiB
Markdown
44 lines
1.4 KiB
Markdown
# 腾讯手写识别接口转接
|
||
|
||
1. 输入图片的BASE64,返回识别结果
|
||
|
||
2. 使用JSON POST传输,返回JSON,符合restful风格
|
||
3. 入参:
|
||
- 图片的BASE64,string
|
||
- Scene:场景,默认是null,可选only_hw,string
|
||
- apikey: 测试期间,设置为固定值:1234567890,string
|
||
4. 出参:
|
||
- 识别结果,string
|
||
- 成功与否,boolean
|
||
|
||
6. 使用腾讯通用手写体识别OCR SDK进行图像识别, 使用go语言,gin框架开发;
|
||
7. 流程:
|
||
- 应用接收到POST数据以后,校验数据的合法性(json格式、base64格式等);
|
||
- 调用腾讯通用手写体识别OCR SDK进行图像识别;
|
||
- 再调用google gemini的api进行组织语言,去除可能识别的错误。使用如下prompt:
|
||
```
|
||
你是一个专业的助手,负责纠正OCR识别结果中的文本。只需要输出识别结果,不需要输出任何解释。
|
||
```
|
||
- 返回识别结果。
|
||
|
||
8. google gemini的api key:"your key"
|
||
9. tencentSecretId = "your id",tencentSecretKey = "your secret"
|
||
|
||
10. key存储在.env文件中,使用dotenv库进行加载。
|
||
11. 增加rate功能,批改作文
|
||
```
|
||
项目结构
|
||
```
|
||
your-project/
|
||
├── go.mod
|
||
├── go.sum
|
||
├── cmd/
|
||
│ └── server/
|
||
│ └── main.go
|
||
└── pkg/
|
||
├── config/
|
||
│ └── config.go
|
||
└── handler/
|
||
└── ocr.go
|
||
└── rate.go
|
||
``` |