在当今这个信息爆炸、视觉内容占据重要地位的数字化营销时代,图片处理成为了企业和个人吸引受众注意力、提升品牌形象的关键环节。然而,图片角度不正这一问题常常困扰着大家,它不仅影响图片的美观度,在营销场景下,还可能降低产品展示效果,影响品牌宣传。而OCR - API软件的出现,就像一位专业的图片管家,轻松解决这些困扰。

一、OCR-API软件概述:基于强大框架的卓越之作

OCR-API是一款专注于解决图片角度不正问题的图像识别软件,它基于burn框架重新进行数据训练。burn框架是一种高效的深度学习框架,具有训练速度快、模型精度高等优点,这使得OCR - API在图片角度识别和转正方面具有出色的性能。其模型训练参考了https://d4nst.github.io/2017/01/12/image-orientation/ ,这个参考链接提供了一种高效的图像角度识别算法,通过该算法,OCR-API能够快速准确地识别图片的角度。

二、丰富的应用场景:满足多领域需求

电商领域:在电商平台上,商品图片的展示效果直接影响顾客的购买意愿。商家常常需要处理大量的商品图片,而OCR-API可以快速调整商品图片的角度,使商品以最佳的视觉效果展示给顾客,从而提高商品的吸引力和销售转化率。

社交媒体方面:对于个人用户和品牌运营者来说,社交媒体上的照片质量至关重要。使用OCR-API,可以快速调整照片的角度,提升照片的美观度和专业性,增强用户体验,吸引更多的关注和点赞,有助于扩大个人或品牌的影响力。

企业宣传资料制作:企业在制作宣传册、海报等资料时,经常会用到各种图片素材。OCR-API能够确保这些图片的角度正确,使宣传资料更加美观、专业,有效地传达企业的形象和信息。

三、软件的特色与优势:全方位的卓越体验

(一)高效识别

OCR-API采用先进的图像识别技术,其基于burn框架重新训练的数据模型能够迅速准确地识别图片的角度,并进行自动转正。这一功能在处理大量图片时,能够极大地提高工作效率,节省时间成本。

(二)易用性

软件提供简洁明了的API接口,用户只需按照接口说明进行调用,即可轻松实现图片转正功能。即使是非技术人员,也能快速上手,轻松操作。

(三)低硬件要求

OCR-API对硬件要求极低,即使在512M内存的机器上也能流畅运行。这意味着无论您是使用个人电脑还是企业的老旧设备,都可以顺利运行该软件,满足各种环境下的使用需求,降低了使用成本。

(四)安全性

通过配置文件中的card_no和token进行身份验证,确保API接口的安全性,保护用户数据不被泄露。card_no是软件的授权密钥,用户需要购买并填写正确的值;token是API接口的身份验证密钥,用户可以自定义修改。

四、软件配置文件config.ini:关键参数的详细解读

OCR - API的配置文件config.ini是软件运行的关键,以下是对其更详细的说明:

[config]
card_no = S8B5FC1234423482782A42979A  # 卡密号,是软件的授权标识,需要购买获取。若要修改卡密号,修改后必须重启服务才能生效。这一设置确保了软件的正版使用,保护了软件开发者的权益。
token = e10adc39121230f883e  # 请求api接口需要用到的身份验证密钥,这里可以根据用户需求自定义修改,但修改后同样需要重启服务才能生效。token的存在保障了API接口调用的安全性,防止非法调用。
port = 3000  # 服务端口号默认设置为3000,用户可以根据实际网络环境和需求对端口号进行修改,不过修改后也需要重启服务使新的设置生效。 

五、API接口调用:深入探索

(一)接口调用基本信息

OCR-API提供了简洁易用的API接口,用户只需通过HTTP POST请求即可调用。

接口地址:http://127.0.0.1:3000/yzm_api/xuanzhuan/:token/b64(其中:token需要替换成配置文件中的token字符串)

请求方法:POST

参数:img 字符串,图片内容需要将bytes转换成base64,不支持二进制格式

接口返回格式:

{
    "code": 0, 
    "msg": "", 
    "data": 192.00002
}

其中,code:0表示成功,500表示失败;data:返回需要转正的角度(单位:度)

(二)可能出现的问题及解决方案

  1. API接口调用失败 首先检查网络连接是否正常。可以尝试打开其他网页或者网络应用,若网络连接存在问题,修复网络后再次尝试调用API接口。

检查配置文件中的参数是否正确。确认token是否正确替换,card_no是否有效,以及port号是否与实际设置一致。

确保图片格式符合要求。图片内容需要正确地将bytes转换成base64格式,不支持二进制格式。如果图片格式错误,需要重新处理图片格式后再进行调用。

六、Python调用接口实例代码

为了让用户更加直观地了解如何使用OCR-API,我们提供了以下Python调用接口的实例代码:

##案例
import requests
import base64
import matplotlib.pyplot as plt
from PIL import Image

# 配置文件中的token
token = "e10adc3949ba59abbe56e057f20f883e"
# 图片路径
image_path = r"C:\Users\hcq\Desktop\ox.jpg"

img = Image.open(image_path)

# 读取图片并转换为base64编码
with open(image_path, "rb") as image_file: 
    image_bytes = image_file.read()
    image_base64 = base64.b64encode(image_bytes).decode('utf-8')

# 构造API请求URL
api_url = f"http://127.0.0.1:3000/yzm_api/xuanzhuan/{token}/b64"

# 发送POST请求
response = requests.post(api_url, data={"img": image_base64})

# 解析响应结果
if response.status_code == 200: 
    result = response.json()
    if result["code"] == 0: 
        print(f"图片需要转正的角度为:{result['data']}度")
    else: 
        print(f"API调用失败,错误信息:{result['msg']}")
else: 
    print(f"API请求失败,状态码:{response.status_code}")


degree = result["data"]
img2 = img.rotate(
    -degree, resample=Image.Resampling.BILINEAR, fillcolor=(255, 255, 255)
)  # use neg degree to recover the img
plt.figure("debug")
# plt.imshow(img)
_fig, axes = plt.subplots(1, 2, figsize=(10, 5))
axes[0].imshow(img)
axes[1].imshow(img2)
plt.show()

OCR-API作为一款高效、易用、安全的图片转正角度识别软件,无论是在提升营销效果,还是满足日常图片处理需求方面,都具有不可替代的价值。它就像一把万能钥匙,为您打开图片处理的便捷之门,让您在图片处理的世界里畅行无阻。

下载地址

通过百度网盘分享的文件:ocr_api.zip

链接:https://pan.baidu.com/s/1bNduTcMKQ4D-mO20FJfx9A?pwd=eyn2

提取码:eyn2

最后

任何软件都有bug

ocr-api识别图片转正角度有一定的识别率,这是根据训练数据集有关系,请理性看待!!!

卡密地址:https://www.h3blog.com/account/auth_cards/add?code=ocr-api

QQ:466867714

本软件仅供学习、研究,请勿用于非法用途