飞桨常规赛:PALM眼底彩照中黄斑中央凹定位-11月第1名方案

本文分享飞桨常规赛PALM眼底彩照黄斑中央凹定位11月第1名方案。介绍赛事与数据后,详述自定义数据集读取、新数据增强方法,给出具体实现代码,包括数据处理、模型组网、训练评估等,还提及结果投票集成,最后总结改善方向与飞桨使用建议。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

飞桨常规赛:palm眼底彩照中黄斑中央凹定位-11月第1名方案 - 创想鸟

飞桨常规赛:PALM眼底彩照中黄斑中央凹定位-11月第1名方案

(1)比赛介绍

赛题介绍

榜首个人主页,戳此处查看

PALM黄斑定位常规赛的重点是研究和发展与患者眼底照片黄斑结构定位相关的算法。该常规赛的目标是评估和比较在一个常见的视网膜眼底图像数据集上定位黄斑的自动算法。具体目的是预测黄斑中央凹在图像中的坐标值。

飞桨常规赛:PALM眼底彩照中黄斑中央凹定位-11月第1名方案 - 创想鸟        

中央凹是视网膜中辨色力、分辨力最敏锐的区域。以人为例,在视盘颞侧约3.5mm处,有一黄色小区,称黄斑,其中央的凹陷,就是中央凹。中央凹的准确定位可辅助医生完成糖尿病视网膜、黄斑变性等病变的诊断。

赛程赛制

(1)飞桨常规赛面向全社会公开报名,直至赛题下线;

(2)飞桨常规赛不设初赛、复赛,以当月每位参赛选手提交的最优成绩排名。每月竞赛周期为本月 1 日至本月最后 1 日;

(3)比赛期间选手每天最多可提交 5 次作品(预测结果+原始代码),系统自动选取最高成绩作为榜单记录;

(4)每个月 1-5 日公布上一个月总榜。当月排名前10 且通过代码复查的选手可获得由百度飞桨颁发的荣誉证书。对于初次上榜的参赛选手,还可额外获得1份特别礼包(1个飞桨周边奖品+ 100小时GPU算力卡)。工作人员将以邮件形式通知上一月排名前10的选手提交材料供代码复查,请各位参赛选手留意邮箱通知。特别提醒: 已获得过特别礼包的参赛选手,如果基于本赛题撰写新的studio项目并被评为精选,才可再次获得1份特别礼包;

(5) score超过0.04的第一位选手可额外获得大奖:小度在家;

(6) 鼓励选手报名多个主题的飞桨常规赛,以赛促学,全方面提升开发者的深度学习能力。

(2)数据介绍

PALM病理性近视预测常规赛由中山大学中山眼科中心提供800张带黄斑中央凹坐标标注的眼底彩照供选手训练模型,另提供400张带标注数据供平台进行模型测试。

数据说明

本次常规赛提供的金标准由中山大学中山眼科中心的7名眼科医生手工进行标注,之后由另一位高级专家将它们融合为最终的标注结果。本比赛提供数据集对应的黄斑中央凹坐标信息存储在xlsx文件中,名为“Fovea_Location_train”,第一列对应眼底图像的文件名(包括扩展名“.jpg”),第二列包含x坐标,第三列包含y坐标。 图

训练数据集

文件名称:Train Train文件夹里有一个文件夹fundus_images和一个xlsx文件。

fundus_images文件夹内包含800张眼底彩照,分辨率为1444×1444,或2124×2056。命名形如H0001.jpg、P0001.jpg、N0001.jpg和V0001.jpg。 xlsx文件中包含800张眼底彩照对应的x、y坐标信息。

测试数据集

文件名称:PALM-Testing400-Images 文件夹里包含400张眼底彩照,命名形如T0001.jpg。

(3)个人思路+个人方案亮点

自定义数据集读取图片和标签

class dataset(paddle.io.Dataset):    def __init__(self,img_list,label_listx,label_listy,transform=None,transform2=None,mode='train'):        self.image=img_list        self.labelx=label_listx        self.labely=label_listy        self.mode=mode        self.transform=transform        self.transform2=transform2    def load_img(self, image_path):        img=cv2.imread(image_path,1)        img=cv2.cvtColor(img,cv2.COLOR_BGR2RGB)        h,w,c=img.shape        return img,h,w    def __getitem__(self,index):        img,h,w = self.load_img(self.image[index])        labelx = self.labelx[index]        labely = self.labely[index]        img_size=img.shape        if self.transform:            if self.mode=='train':                img, label = self.transform([img, [labelx,labely]])            else:                img, label = self.transform2([img, [labelx,labely]])                        label=np.array(label,dtype='float32')        img=np.array(img,dtype='float32')/255.0        return img,label    def __len__(self):        return len(self.image)

       

使用新的数据增强方法对数据进行增广

class py1(object):    # 将输入图像调整为指定大小    def __init__(self, output_size):        assert isinstance(output_size, (int, tuple))        self.output_size = output_size    def __call__(self, data):        image = data[0]    # 获取图片        key_pts = data[1]  # 获取标签        image_copy = np.copy(image)              key_pts_copy = np.copy(key_pts)        h, w = image_copy.shape[:2]        if key_pts_copy[0]<self.output_size:            left=np.random.random()*key_pts_copy[0]        elif w-key_pts_copy[0]<self.output_size:            left=w-(w-key_pts_copy[0])*np.random.random()-self.output_size        else:            left=key_pts_copy[0]-self.output_size*np.random.random()                                            if key_pts_copy[1]<self.output_size:            top=np.random.random()*key_pts_copy[1]        elif h-key_pts_copy[1]<self.output_size:            top=w-(h-key_pts_copy[1])*np.random.random()-self.output_size        else:            top=key_pts_copy[1]-self.output_size*np.random.random()         left=int(left)        top=int(top)        x=(key_pts_copy[0]-left)/self.output_size        y=(key_pts_copy[1]-top)/self.output_size        img=image_copy[top:top+self.output_size,left:left+self.output_size]        return img, [x,y]class py2(object):    # 将输入图像调整为指定大小    def __init__(self, output_size):        assert isinstance(output_size, (int, tuple))        self.output_size = output_size    def __call__(self, data):        image = data[0]    # 获取图片        key_pts = data[1]  # 获取标签        image_copy = np.copy(image)              key_pts_copy = np.copy(key_pts)        h, w = image_copy.shape[:2]        if key_pts_copy[0]<self.output_size/2:            left=0        elif w-key_pts_copy[0]<self.output_size/2:            left=w-self.output_size        else:            left=key_pts_copy[0]-self.output_size/2                                     if key_pts_copy[1]<self.output_size/2:            top=0        elif h-key_pts_copy[1]<self.output_size/2:            top=w-self.output_size        else:            top=key_pts_copy[1]-self.output_size/2        left=int(left)        top=int(top)        x=(key_pts_copy[0]-left)/self.output_size        y=(key_pts_copy[1]-top)/self.output_size        img=image_copy[top:top+self.output_size,left:left+self.output_size]        return img, [x,y]class GrayNormalize(object):    # 将图片变为灰度图,并将其值放缩到[0, 1]    # 将 label 放缩到 [-1, 1] 之间    def __call__(self, data):        image = data[0]   # 获取图片        key_pts = data[1] # 获取标签                image_copy = np.copy(image)        key_pts_copy = np.copy(key_pts)        # 灰度化图片        gray_scale = paddle.vision.transforms.Grayscale(num_output_channels=3)        image_copy = gray_scale(image_copy)                ## 将图片值放缩到 [0, 1]        #image_copy = (image_copy-127.5) /127.5                # 将坐标点放缩到 [-1, 1]        #mean = data_mean # 获取标签均值        #std = data_std   # 获取标签标准差        #key_pts_copy = (key_pts_copy - mean)/std        return image_copy, key_pts_copyclass ToCHW(object):    # 将图像的格式由HWC改为CHW    def __call__(self, data):        image = data[0]        key_pts = data[1]        transpose = T.Transpose((2, 0, 1)) # 改为CHW        image = transpose(image)                return image, key_pts

   

(4)具体方案分享

代码参考:『深度学习7日打卡营』人脸关键点检测

解压数据集

In [1]

!unzip -oq /home/aistudio/data/data116960/常规赛:PALM眼底彩照中黄斑中央凹定位.zip!mv │г╣ц╚№г║PALM╤█╡╫▓╩╒╒╓╨╗╞░▀╓╨╤ы░╝╢и╬╗ 常规赛:PALM眼底彩照中黄斑中央凹定位 #不知道为什么会出现乱码,可用此代码恢复中文!rm -rf __MACOSX

   

查看数据标签

In [1]

import blackhole.dataframe as pddf=pd.read_excel('常规赛:PALM眼底彩照中黄斑中央凹定位/Train/Fovea_Location_train.xlsx')df.head()

       


               

     imgName  Fovea_X  Fovea_Y0  H0001.jpg   743.96   790.541  H0002.jpg  1394.82   725.542  H0003.jpg  1361.74   870.723  H0004.jpg   703.15   742.444  H0005.jpg  1070.95  1037.54

               

数据增强

In [2]

import paddle.vision.transforms.functional as Fclass py1(object):    # 将输入图像调整为指定大小    def __init__(self, output_size):        assert isinstance(output_size, (int, tuple))        self.output_size = output_size    def __call__(self, data):        image = data[0]    # 获取图片        key_pts = data[1]  # 获取标签        image_copy = np.copy(image)              key_pts_copy = np.copy(key_pts)        h, w = image_copy.shape[:2]        if key_pts_copy[0]<self.output_size:            left=np.random.random()*key_pts_copy[0]        elif w-key_pts_copy[0]<self.output_size:            left=w-(w-key_pts_copy[0])*np.random.random()-self.output_size        else:            left=key_pts_copy[0]-self.output_size*np.random.random()                                            if key_pts_copy[1]<self.output_size:            top=np.random.random()*key_pts_copy[1]        elif h-key_pts_copy[1]<self.output_size:            top=w-(h-key_pts_copy[1])*np.random.random()-self.output_size        else:            top=key_pts_copy[1]-self.output_size*np.random.random()         left=int(left)        top=int(top)        x=(key_pts_copy[0]-left)/self.output_size        y=(key_pts_copy[1]-top)/self.output_size        img=image_copy[top:top+self.output_size,left:left+self.output_size]        return img, [x,y]class py2(object):    # 将输入图像调整为指定大小    def __init__(self, output_size):        assert isinstance(output_size, (int, tuple))        self.output_size = output_size    def __call__(self, data):        image = data[0]    # 获取图片        key_pts = data[1]  # 获取标签        image_copy = np.copy(image)              key_pts_copy = np.copy(key_pts)        h, w = image_copy.shape[:2]        if key_pts_copy[0]<self.output_size/2:            left=0        elif w-key_pts_copy[0]<self.output_size/2:            left=w-self.output_size        else:            left=key_pts_copy[0]-self.output_size/2                                     if key_pts_copy[1]<self.output_size/2:            top=0        elif h-key_pts_copy[1]<self.output_size/2:            top=w-self.output_size        else:            top=key_pts_copy[1]-self.output_size/2        left=int(left)        top=int(top)        x=(key_pts_copy[0]-left)/self.output_size        y=(key_pts_copy[1]-top)/self.output_size        img=image_copy[top:top+self.output_size,left:left+self.output_size]        return img, [x,y]class GrayNormalize(object):    # 将图片变为灰度图,并将其值放缩到[0, 1]    # 将 label 放缩到 [-1, 1] 之间    def __call__(self, data):        image = data[0]   # 获取图片        key_pts = data[1] # 获取标签                image_copy = np.copy(image)        key_pts_copy = np.copy(key_pts)        # 灰度化图片        gray_scale = paddle.vision.transforms.Grayscale(num_output_channels=3)        image_copy = gray_scale(image_copy)                ## 将图片值放缩到 [0, 1]        #image_copy = (image_copy-127.5) /127.5                # 将坐标点放缩到 [-1, 1]        #mean = data_mean # 获取标签均值        #std = data_std   # 获取标签标准差        #key_pts_copy = (key_pts_copy - mean)/std        return image_copy, key_pts_copyclass ToCHW(object):    # 将图像的格式由HWC改为CHW    def __call__(self, data):        image = data[0]        key_pts = data[1]        transpose = T.Transpose((2, 0, 1)) # 改为CHW        image = transpose(image)                return image, key_pts

   In [3]

import paddle.vision.transforms as Tdata_transform = T.Compose([                        py1(224),                                                GrayNormalize(),                        ToCHW(),                         ])data_transform2 = T.Compose([                        py2(224),                        GrayNormalize(),                        ToCHW(),                        ])

   

自定义数据集

In [4]

path='常规赛:PALM眼底彩照中黄斑中央凹定位/Train/fundus_image/'df=df.sample(frac=1)image_list=[]label_listx=[]label_listy=[]for i in range(len(df)):        image_list.append(path+df['imgName'][i])        label_listx.append(df['Fovea_X'][i])        label_listy.append(df['Fovea_Y'][i])

   In [5]

import ostest_path='常规赛:PALM眼底彩照中黄斑中央凹定位/PALM-Testing400-Images'test_list=[]test_labelx=[]test_labely=[]#list=pd.read_csv('result54.70313.csv')list=pd.read_csv('????.csv')   #????.csv为以前提交的结果文件,选一个成绩好的。#list = os.listdir(test_path)  # 列出文件夹下所有的目录与文件for i in range(0, len(list)):    path = os.path.join(test_path, list['FileName'][i])    test_list.append(path)    test_labelx.append(list['Fovea_X'][i])    test_labely.append(list['Fovea_Y'][i])

   In [6]

import paddleimport cv2import numpy as npclass dataset(paddle.io.Dataset):    def __init__(self,img_list,label_listx,label_listy,transform=None,transform2=None,mode='train'):        self.image=img_list        self.labelx=label_listx        self.labely=label_listy        self.mode=mode        self.transform=transform        self.transform2=transform2    def load_img(self, image_path):        img=cv2.imread(image_path,1)        img=cv2.cvtColor(img,cv2.COLOR_BGR2RGB)        h,w,c=img.shape        return img,h,w    def __getitem__(self,index):        img,h,w = self.load_img(self.image[index])        labelx = self.labelx[index]        labely = self.labely[index]        img_size=img.shape        if self.transform:            if self.mode=='train':                img, label = self.transform([img, [labelx,labely]])            else:                img, label = self.transform2([img, [labelx,labely]])                        label=np.array(label,dtype='float32')        img=np.array(img,dtype='float32')/255.0        return img,label    def __len__(self):        return len(self.image)

   

训练集、验证集、测试集

In [7]

radio=0.8train_list=image_list[:int(len(image_list)*radio)]train_labelx=label_listx[:int(len(label_listx)*radio)]train_labely=label_listy[:int(len(label_listy)*radio)]val_list=image_list[int(len(image_list)*radio):]val_labelx=label_listx[int(len(label_listx)*radio):]val_labely=label_listy[int(len(label_listy)*radio):]train_ds=dataset(train_list,train_labelx,train_labely,data_transform,data_transform2,'train')val_ds=dataset(val_list,val_labelx,val_labely,data_transform,data_transform2,'valid')test_ds=dataset(test_list,test_labelx,test_labely,data_transform,data_transform2,'test')

   

查看图片

In [14]

import matplotlib.pyplot as pltfor i,data in enumerate(train_ds):        img,label=data    img=img.transpose([1,2,0])    print(img.shape)    plt.title(label*224)    plt.imshow(img)    plt.show()    if i==0:        break

       

(224, 224, 3)

       

               

模型组网

以下两个网络结构任选一

In [15]

class MyNet1(paddle.nn.Layer):    def __init__(self,num_classes=2):        super(MyNet1,self).__init__()        self.net=paddle.vision.resnet152(pretrained=True)        self.fc1=paddle.nn.Linear(1000,512)        self.relu=paddle.nn.ReLU()        self.fc2=paddle.nn.Linear(512,num_classes)    def forward(self,inputs):        out=self.net(inputs)        out=self.fc1(out)        out=self.relu(out)        out=self.fc2(out)        return out

   In [17]

class MyNet2(paddle.nn.Layer):    def __init__(self):        super(MyNet2, self).__init__()        self.resnet = paddle.vision.resnet50(pretrained=True, num_classes=0) # remove final fc 输出为[?, 2048, 1, 1]        self.flatten = paddle.nn.Flatten()        self.linear_1 = paddle.nn.Linear(2048, 512)        self.linear_2 = paddle.nn.Linear(512, 256)        self.linear_3 = paddle.nn.Linear(256, 2)        self.relu = paddle.nn.ReLU()        self.dropout = paddle.nn.Dropout(0.2)        def forward(self, inputs):        y = self.resnet(inputs)        y = self.flatten(y)        y = self.linear_1(y)        y = self.linear_2(y)        y = self.relu(y)        y = self.dropout(y)        y = self.linear_3(y)        y = paddle.nn.functional.sigmoid(y)        return y

   

异步加载数据

In [18]

train_loader = paddle.io.DataLoader(train_ds, places=paddle.CPUPlace(), batch_size=32, shuffle=True, num_workers=0)val_loader = paddle.io.DataLoader(val_ds, places=paddle.CPUPlace(), batch_size=32, shuffle=False, num_workers=0)test_loader=paddle.io.DataLoader(test_ds, places=paddle.CPUPlace(), batch_size=32, shuffle=False, num_workers=0)

   

自定义损失函数

In [19]

from sklearn.metrics.pairwise import euclidean_distances import paddle.nn as nn# 损失函数def cal_coordinate_Loss(logit, label, alpha = 0.5):    """    logit: shape [batch, ndim]    label: shape [batch, ndim]    ndim = 2 represents coordinate_x and coordinaate_y    alpha: weight for MSELoss and 1-alpha for ED loss    return: combine MSELoss and ED Loss for x and y, shape [batch, 1]    """    alpha = alpha    mse_loss = nn.MSELoss(reduction='mean')    mse_x = mse_loss(logit[:,0],label[:,0])    mse_y = mse_loss(logit[:,1],label[:,1])    mse_l = 0.5*(mse_x + mse_y)    # print('mse_l', mse_l)    ed_loss = []    # print(logit.shape[0])    for i in range(logit.shape[0]):        logit_tmp = logit[i,:].numpy()        label_tmp = label[i,:].numpy()        # print('cal_coordinate_loss_ed', logit_tmp, label_tmp)                ed_tmp = euclidean_distances([logit_tmp], [label_tmp])        # print('ed_tmp:', ed_tmp[0][0])        ed_loss.append(ed_tmp)        ed_l = sum(ed_loss)/len(ed_loss)    # print('ed_l', ed_l)    # print('alpha', alpha)    loss = alpha * mse_l + (1-alpha) * ed_l    # print('loss in function', loss)    return loss

   In [20]

class SelfDefineLoss(paddle.nn.Layer):   """   1. 继承paddle.nn.Layer   """   def __init__(self):       """       2. 构造函数根据自己的实际算法需求和使用需求进行参数定义即可       """       super(SelfDefineLoss, self).__init__()   def forward(self, input, label):       """       3. 实现forward函数,forward在调用时会传递两个参数:input和label           - input:单个或批次训练数据经过模型前向计算输出结果           - label:单个或批次训练数据对应的标签数据           接口返回值是一个Tensor,根据自定义的逻辑加和或计算均值后的损失       """       # 使用PaddlePaddle中相关API自定义的计算逻辑       output = cal_coordinate_Loss(input,label)       return output

   

模型训练与可视化

如果图片尺寸较大应适当调小Batch_size,防止爆显存。

In [22]

from utils import NMEimport warningswarnings.filterwarnings('ignore')visualdl=paddle.callbacks.VisualDL(log_dir='visual_log')#定义输入Batch_size=32EPOCHS=20step_each_epoch = len(train_ds)//Batch_size# 使用 paddle.Model 封装模型model = paddle.Model(MyNet2())#模型加载#model.load('/home/aistudio/work/lup/final')lr = paddle.optimizer.lr.CosineAnnealingDecay(learning_rate=1e-5,                                                T_max=step_each_epoch * EPOCHS)# 定义Adam优化器optimizer = paddle.optimizer.Adam(learning_rate=lr,                                weight_decay=1e-5,                                parameters=model.parameters())# 定义SmoothL1Lossloss =paddle.nn.SmoothL1Loss()#loss =SelfDefineLoss()# 使用自定义metricsmetric = NME()model.prepare(optimizer=optimizer, loss=loss, metrics=metric)# 训练可视化VisualDL工具的回调函数# 启动模型全流程训练model.fit(train_loader,  # 训练数据集          val_loader,   # 评估数据集          epochs=EPOCHS,       # 训练的总轮次          batch_size=Batch_size,  # 训练使用的批大小          save_dir="/home/aistudio/work/lup", #把模型参数、优化器参数保存至自定义的文件夹          save_freq=1,                    #设定每隔多少个epoch保存模型参数及优化器参数          verbose=1 ,      # 日志展示形式          callbacks=[visualdl]          )  # 设置可视化

       

The loss value printed in the log is the current step, and the metric is the average value of previous steps.Epoch 1/20step 20/20 [==============================] - loss: 0.0604 - nme: 0.4010 - 4s/step           save checkpoint at /home/aistudio/work/lup/0Eval begin...step 5/5 [==============================] - loss: 0.0053 - nme: 0.1495 - 8s/stepEval samples: 160Epoch 2/20step 20/20 [==============================] - loss: 0.0361 - nme: 0.3705 - 2s/step           save checkpoint at /home/aistudio/work/lup/1Eval begin...step 5/5 [==============================] - loss: 0.0100 - nme: 0.1334 - 2s/stepEval samples: 160Epoch 3/20step 20/20 [==============================] - loss: 0.0350 - nme: 0.3663 - 2s/step           save checkpoint at /home/aistudio/work/lup/2Eval begin...step 5/5 [==============================] - loss: 0.0096 - nme: 0.1611 - 2s/stepEval samples: 160Epoch 4/20step 20/20 [==============================] - loss: 0.0353 - nme: 0.3423 - 2s/step           save checkpoint at /home/aistudio/work/lup/3Eval begin...step 5/5 [==============================] - loss: 0.0057 - nme: 0.1399 - 2s/stepEval samples: 160Epoch 5/20step 20/20 [==============================] - loss: 0.0325 - nme: 0.3279 - 2s/step           save checkpoint at /home/aistudio/work/lup/4Eval begin...step 5/5 [==============================] - loss: 0.0063 - nme: 0.1391 - 2s/stepEval samples: 160Epoch 6/20step 20/20 [==============================] - loss: 0.0288 - nme: 0.3110 - 2s/step           save checkpoint at /home/aistudio/work/lup/5Eval begin...step 5/5 [==============================] - loss: 0.0057 - nme: 0.1273 - 2s/stepEval samples: 160Epoch 7/20step 20/20 [==============================] - loss: 0.0219 - nme: 0.2979 - 2s/step           save checkpoint at /home/aistudio/work/lup/6Eval begin...step 5/5 [==============================] - loss: 0.0060 - nme: 0.1356 - 2s/stepEval samples: 160Epoch 8/20step 20/20 [==============================] - loss: 0.0339 - nme: 0.3089 - 2s/step           save checkpoint at /home/aistudio/work/lup/7Eval begin...step 5/5 [==============================] - loss: 0.0060 - nme: 0.1382 - 2s/stepEval samples: 160Epoch 9/20step 20/20 [==============================] - loss: 0.0246 - nme: 0.3041 - 2s/step           save checkpoint at /home/aistudio/work/lup/8Eval begin...step 5/5 [==============================] - loss: 0.0067 - nme: 0.1365 - 2s/stepEval samples: 160Epoch 10/20step 20/20 [==============================] - loss: 0.0315 - nme: 0.3006 - 2s/step           save checkpoint at /home/aistudio/work/lup/9Eval begin...step 5/5 [==============================] - loss: 0.0061 - nme: 0.1383 - 2s/stepEval samples: 160Epoch 11/20step 20/20 [==============================] - loss: 0.0254 - nme: 0.3009 - 2s/step           save checkpoint at /home/aistudio/work/lup/10Eval begin...step 5/5 [==============================] - loss: 0.0061 - nme: 0.1386 - 2s/stepEval samples: 160Epoch 12/20step 20/20 [==============================] - loss: 0.0273 - nme: 0.2984 - 2s/step           save checkpoint at /home/aistudio/work/lup/11Eval begin...step 5/5 [==============================] - loss: 0.0069 - nme: 0.1412 - 2s/stepEval samples: 160Epoch 13/20step 20/20 [==============================] - loss: 0.0365 - nme: 0.2950 - 2s/step           save checkpoint at /home/aistudio/work/lup/12Eval begin...step 20/20 [==============================] - loss: 0.0340 - nme: 0.2917 - 2s/step           save checkpoint at /home/aistudio/work/lup/13Eval begin...step 5/5 [==============================] - loss: 0.0066 - nme: 0.1376 - 2s/stepEval samples: 160Epoch 15/20step 20/20 [==============================] - loss: 0.0331 - nme: 0.2910 - 2s/step           save checkpoint at /home/aistudio/work/lup/14Eval begin...step 5/5 [==============================] - loss: 0.0070 - nme: 0.1403 - 2s/stepEval samples: 160Epoch 16/20step 20/20 [==============================] - loss: 0.0334 - nme: 0.2885 - 2s/step           save checkpoint at /home/aistudio/work/lup/15Eval begin...step 5/5 [==============================] - loss: 0.0066 - nme: 0.1383 - 2s/stepEval samples: 160Epoch 17/20step 20/20 [==============================] - loss: 0.0373 - nme: 0.2919 - 2s/step           save checkpoint at /home/aistudio/work/lup/16Eval begin...step 5/5 [==============================] - loss: 0.0069 - nme: 0.1401 - 2s/stepEval samples: 160Epoch 18/20step 20/20 [==============================] - loss: 0.0232 - nme: 0.2843 - 2s/step           save checkpoint at /home/aistudio/work/lup/17Eval begin...step 5/5 [==============================] - loss: 0.0064 - nme: 0.1348 - 2s/stepEval samples: 160Epoch 19/20step 20/20 [==============================] - loss: 0.0291 - nme: 0.2869 - 2s/step           save checkpoint at /home/aistudio/work/lup/18Eval begin...step 5/5 [==============================] - loss: 0.0068 - nme: 0.1389 - 2s/stepEval samples: 160Epoch 20/20step 20/20 [==============================] - loss: 0.0342 - nme: 0.2946 - 2s/step           save checkpoint at /home/aistudio/work/lup/19Eval begin...step 5/5 [==============================] - loss: 0.0062 - nme: 0.1368 - 2s/stepEval samples: 160save checkpoint at /home/aistudio/work/lup/final

       

模型评估

In [23]

# 模型评估model.load('/home/aistudio/work/lup/5')result = model.evaluate(val_loader, verbose=1)print(result)

       

Eval begin...step 5/5 [==============================] - loss: 0.0057 - nme: 0.1273 - 2s/stepEval samples: 160{'loss': [0.005723397], 'nme': 0.1273284799297331}

       

进行预测操作

In [24]

# 进行预测操作result = model.predict(test_loader)

       

Predict begin...step 13/13 [==============================] - 2s/step          Predict samples: 400

       In [26]

# 获取测试图片尺寸和图片名test_path='常规赛:PALM眼底彩照中黄斑中央凹定位/PALM-Testing400-Images'test_size=[]FileName=[]for i in range(len(list)):    #path = os.path.join(test_path, list[i])    path=test_list[i]    img=cv2.imread(path,1)    test_size.append(img.shape)    FileName.append(list['FileName'][i])test_size=np.array(test_size)

   In [32]

result=np.array(result)pred=[]for i in range(len(result[0])):    pred.extend(result[0][i])pred=np.array(pred) pred = paddle.to_tensor(pred)out=np.array(pred).reshape(-1,2)#Fovea_X=out[:,0]*data_std+data_mean#Fovea_Y=out[:,1]*data_std+data_meanFovea_X=out[:,0]Fovea_Y=out[:,1]#Fovea_X=Fovea_X*test_size[:,1]#Fovea_Y=Fovea_Y*test_size[:,0]for i in range(400):    if test_labelx[i](test_size[i][1]-112):        x0=test_size[i][1]-112    else:        x0=test_labelx[i]-112    if test_labely[i]test_size[i][0]-112:        y0=test_size[i][0]-112    else:        y0=test_labely[i]-112    Fovea_X[i]=x0+Fovea_X[i]*224    Fovea_Y[i]=y0+Fovea_Y[i]*224submission = pd.DataFrame(data={                            "FileName": FileName,                            "Fovea_X": Fovea_X,                            "Fovea_Y": Fovea_Y                        })submission=submission.sort_values(by='FileName')submission.to_csv("result.csv", index=False)

   

结果文件查看

In [33]

submission.head()

       

    FileName      Fovea_X      Fovea_Y0  T0001.jpg  1275.212769   947.6381231  T0002.jpg  1078.371338  1054.0875242  T0003.jpg  1079.881104  1059.2928473  T0004.jpg  1302.749023  1016.5989384  T0005.jpg  1309.635010   701.692017

               

结果投票集成

简单投票集成学习,这个可以提升效果,尽量选得分高的进行投票。

在统计学和机器学习中,集成学习方法使用多种学习算法来获得比单独使用任何单独的学习算法更好的预测性能。

使用不同超参数、不同的特征,不同的结构,运行多次模型可得到不同的预测结果。在这里我使用的是简单投票法,取平均值作为最终的预测结果。 预测出多个result后,进行投票,代码如下:

In [ ]

import numpy as npimport blackhole.dataframe as pddf1=pd.read_csv('result40.14874.csv')df2=pd.read_csv('result41.98309.csv')df3=pd.read_csv('result54.70313.csv')df4=pd.read_csv('result49.75246.csv')dfs=[df1,df2,df3,df4]File_Name=[]Fovea_X=[]Fovea_Y=[]for i in range(len(df1)):    File_Name.append(dfs[0]['FileName'][i])    avgx=(sum(np.array(dfs[x]['Fovea_X'][i]) for x in range(len(dfs))))/len(dfs)    avgy=(sum(np.array(dfs[x]['Fovea_Y'][i]) for x in range(len(dfs))))/len(dfs)        Fovea_X.append(avgx)    Fovea_Y.append(avgy)submission = pd.DataFrame(data={                            "FileName": File_Name,                            "Fovea_X": Fovea_X,                            "Fovea_Y":Fovea_Y                        })submission=submission.sort_values(by='FileName')submission.to_csv("result.csv", index=False)

   

(5)总结及改善方向

1、多试几个的预训练模型。

2、选择合适的学习率。

3、更换别的优化器。

4、投票方法能提高成绩,但是存在天花板。

5、曾专门用训练神经网络对中央凹可见、不可见情况进行了分类,结果测试集并未分到中央凹不可见的类别,但是总觉得测试集定位应该有(0,0),不是很确定。

(6)飞桨使用体验+给其他选手学习飞桨的建议

建议大家多参加百度AI Studio课程,多看别人写的AI Studio项目,也许会有灵感迸发,在比赛中取得更好的成绩。

以上就是飞桨常规赛:PALM眼底彩照中黄斑中央凹定位-11月第1名方案的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/52471.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 04:35:45
下一篇 2025年11月9日 04:41:52

相关推荐

  • php特征有哪些

    PHP 是一种开源、跨平台、服务器端的脚本语言,支持面向对象编程,具有广泛的库和框架,易于学习,性能高,并拥有活跃的社区支持。 PHP 的特征 PHP 是一种广泛使用的脚本语言,具有以下一些关键特征: 开源和免费PHP 是开源和免费的,这意味着任何人都可以免费下载、使用和修改源代码。 跨平台PHP …

    2025年12月12日
    000
  • php具有哪些优点

    PHP 是一种易于学习、跨平台、开源、功能强大的服务器端脚本语言,提供丰富的文档、社区支持和广泛的生态系统,确保安全性,在处理大量数据时仍然快速且高效。 PHP 的优点 PHP 是一种广泛使用的服务器端脚本语言,以其强大的功能和灵活性而闻名。以下是 PHP 的一些主要优点: 易于学习和使用: PHP…

    2025年12月12日
    000
  • php源码有哪些

    PHP 源码主要包含:1. Zend 引擎(核心);2. 扩展库(标准库和第三方库);3. 内置函数;4. 用户定义函数;5. APC、OPcache、xdebug 等其他组件。可从官方 PHP 网站、GitHub 或 Composer 获取源码。 PHP 源码有哪些? PHP 是一个开源的脚本语言…

    2025年12月12日
    000
  • php需要哪些技术

    要熟练使用 PHP,需要掌握以下技术:HTML、CSS、数据库概念、数据结构和算法基础PHP 语法、函数、对象和类PHP 框架、数据库连接和查询、表单处理、会话和缓存版本控制系统、Web 服务器、第三方库 PHP 所需的技术 PHP(超文本预处理器)是一种流行的服务器端脚本语言,广泛用于 web 开…

    2025年12月12日
    000
  • php需要哪些知识

    PHP 所需知识:基础编程概念HTML 和 CSSWeb 服务器PHP 语言数据库(SQL 和数据库管理系统)服务器端技术框架和库其他(操作系统基础、版本控制、调试和安全性) PHP 所需知识 PHP 是一种广泛使用的服务器端脚本语言,广泛应用于 Web 开发中。它需要以下方面的知识: 基础: 基础…

    2025年12月12日
    000
  • PHP都有哪些优点

    PHP 的主要优点包括:开源且免费跨平台兼容性易于学习活跃的社区支持可扩展性高性能安全功能数据库支持内容管理系统集成面向对象编程 PHP 的优点 PHP 是服务器端脚本语言,因其广泛的用途和易用性而闻名。它提供了众多优点,使它成为开发者中备受欢迎的选择。 1. 开源和免费PHP 是开源和免费的,这使…

    2025年12月12日
    000
  • PHP框架社区活跃程度如何比较?

    php框架社区活跃度比较表明,laravel拥有庞大的活跃社区,codeigniter活跃度稍低,symfony专注于企业级支持,zend framework社区规模较小。衡量社区活跃度的指标包括问题解决响应时间、文档质量、代码示例可用性、版本更新频率和社交媒体参与。 PHP 框架社区活跃度比较 P…

    2025年12月12日
    000
  • php语言有哪些

    PHP是一种开源、免费的服务器端语言,它面向对象,拥有广泛的库和框架。PHP可以轻松交互数据库,性能高,与HTML和CSS紧密集成,并且跨平台兼容。 PHP 语言的特点 PHP(超文本预处理器)是一种用于 Web 开发的开源脚本语言。其主要特点包括: 1. 开源和免费 PHP 是一个免费且开源的语言…

    2025年12月12日
    000
  • PHP框架社区有何独特的文化和规范?

    php框架社区的文化和规范塑造了社区运作和框架发展。这些文化和规范包括:协作和贡献:社区重视协作,欢迎贡献,确保框架持续改进。开放性和包容性:社区欢迎各背景和技能水平的人参与,营造友好的学习环境。文档和支持:框架提供广泛文档和支持渠道,确保用户轻松获取帮助和解决问题。代码质量标准:社区遵循严格的代码…

    2025年12月12日
    000
  • PHP框架社区的知识共享方式有哪些?

    php 框架社区的知识共享方式包括:文档和教程:提供框架特性的详细信息。讨论论坛和 slack 频道:促进讨论、分享提示和获得支持。代码仓库:允许开发人员提交代码改进,促进框架发展。社交媒体社区:分享更新、见解和最佳实践。会议和活动:为开发人员提供聚会、分享想法和交流的机会。 PHP 框架社区中的知…

    2025年12月12日
    000
  • PHP框架社区的知识共享水平

    php 框架社区拥有活跃的知识共享环境,通过文档、论坛、博客和 q&a 网站等平台促成。分享的知识涵盖最佳实践、代码示例、调试技巧和新特性。实战案例表明,社区成员提供具体建议、全面答案和详细指导,帮助开发人员解决问题、优化应用程序和推动框架发展。 PHP 框架社区的知识共享水平 PHP 框架…

    2025年12月12日
    000
  • 如何评价PHP框架社区的协作能力?

    衡量php框架社区协作能力的指标:贡献频率:代码提交数量和频率。问题解决效率:社区问题解决速度。开源许可证:允许fork和修改的开源许可证。社区活动:会议和研讨会等活动。文档和教程:全面且易于遵循的文档。 PHP框架社区:协作能力评估 评估一个开发者社区的协作能力至关重要,因为它反映了社区支持和促进…

    2025年12月12日
    000
  • PHP框架社区支持的最佳实践是什么?

    php 框架社区优化指南:加入讨论区(如 github、官方论坛等)并提出明确的问题,为社区活动做出贡献,实践案例:在 laravel discord 频道寻求电子邮件发送帮助,最佳实践:利用 github 跟踪问题,参与社区拓展网络,回馈社区。 PHP 框架最佳社区实践指南 PHP 框架社区为开发…

    2025年12月12日
    000
  • 如何在 Azure 应用服务上部署具有 CI/CD 管道的 Web 应用

    使用 github 和 visual studio code 在 azure 应用服务上部署具有持续集成/持续部署 (ci/cd) 管道的 web 应用程序涉及几个步骤,我将在下面讨论: 1.设置您的 Azure 帐户并创建 Web 应用程序: 登录 Azure 门户:使用 https://port…

    2025年12月12日 好文分享
    000
  • php有哪些应用

    PHP(超文本预处理器)是一种广泛用于 Web 开发和服务器端编程的开源脚本语言。其最常见的应用包括:Web 开发:动态网页生成、内容管理系统、电子商务平台服务器端编程:Web 服务、命令行工具跨平台开发:可轻松部署在不同服务器上其他应用:桌面应用程序、移动应用程序、机器学习 PHP 的应用 PHP…

    2025年12月12日
    000
  • php有哪些特征

    PHP 是一种开源、跨平台、面向对象的服务器端脚本语言,以其灵活性、易用性和高效性著称。它的主要特征包括:开源且免费,无需支付许可费用。跨平台支持,可在多种操作系统上运行。面向对象,支持类、对象和继承。支持多种数据类型,包括字符串、整数和数组。提供丰富的内置函数,简化开发。支持模块扩展,扩展语言功能…

    2025年12月12日
    000
  • php 技能哟哪些

    对于 PHP 开发人员,需要掌握以下技能:1. 核心 PHP;2. Web 开发;3. 数据库连接和操作;4. 框架和库;5. 安全;6. 测试;7. 其他技能(如终端和命令行知识)。掌握这些技能将使开发人员能够构建健壮、安全且可维护的 Web 应用程序。 PHP 技能要求 PHP 是一种广泛使用的…

    2025年12月12日
    000
  • PHP框架社区支持如何影响代码质量和维护?

    php框架社区支持对代码质量和维护的影响包括:代码审查和协作:提供平台进行代码审查和协作,识别问题和提出改进建议。文档和教程:提供文档和教程,帮助开发者快速上手和编写高质量代码。错误报告和问题跟踪:维护系统,开发者可以提交问题并获得社区帮助。安全审计和补丁:定期进行安全审计,识别和修复漏洞,确保框架…

    2025年12月12日
    000
  • php学哪些软件

    学习 PHP 必备的软件包括:1. PHP 开发环境:XAMPP 或 WAMP;2. PHPStorm;3. 文本编辑器:Notepad++ 或 Sublime Text;4. 数据库管理系统:MySQL 或 PostgreSQL;5. Git 或 Mercurial;6. Composer;7. …

    2025年12月12日
    000
  • php学习哪些课程

    学习 PHP 需掌握的核心课程:语法与数据类型:了解 PHP 语法、数据类型和变量。操作符和控制流:掌握使用操作符和控制流语句处理数据和控制流程。函数和数组:学习创建和使用函数,以及处理数组的知识。HTTP 和 HTML:理解 HTTP 和 HTML 的工作原理。表单和数据处理:学习处理表单数据、验…

    2025年12月12日
    000

发表回复

登录后才能评论
关注微信