Paddle2.0:浅析并实现 CaiT 模型

《Going deeper with Image Transformers》针对图像Transformer优化少的问题,研究构建和优化更深网络。提出LayerScale,在残差块输出乘对角线矩阵,改善训练动态以训练更深模型;设计类别注意力层,分离patch自注意与信息总结。所建CaiT模型在图像分类任务中表现出色。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

paddle2.0:浅析并实现 cait 模型 - 创想鸟

引入

Transformer 最近已在大规模图像分类任务中获得了很高的分数,这逐渐动摇了卷积神经网络的长期霸主地位。但是,到目前为止,对图像 Transformer 的优化还很少进行研究。在这项工作中,作者为图像分类建立和优化了更深的 Transformer 网络。特别是,我们研究了这种专用 Transformer 的架构和优化之间的相互作用。

相关资料

论文:Going deeper with Image Transformers官方实现:facebookresearch/deit

主要改进

这篇论文基于 ViT 和 DeiT 进行研究,探索实现更深层的 Image Transformer 模型的训练,主要有以下两点改进:使用 LayerScale 实现更深层的 Image Transformer 模型(Deeper image transformers with LayerScale)特别设计的类别注意力层(Specializing layers for class attention)

使用 LayerScale 实现更深层的 Image Transformer 模型

原理介绍

Vision Transformer 展示了一种特殊形式的残差结构:在将输入图像转换成一组向量之后,网络将自注意层(SA)与前馈网络(FFN)交替,如下所示:

Paddle2.0:浅析并实现 CaiT 模型 - 创想鸟(公式 1)

其中 η 代表 LayerNorm

但是这种结构无法很好的训练更深层的网络模型,在分析了不同的初始化、优化和体系结构设计之间的相互作用之后,作者提出了一种方法与现有的方法相比,这种方法可以有效地提高更深层的 Image Transformer 模型的训练效果形式上,在每个残差块的输出上添加一个可学习的对角矩阵,初始化接近于 0在每个残差块之后添加这个简单的层提高了训练动态性,允许我们训练更深层的受益于深度的大容量 Image Transformer 模型作者将这种方法称为 LayerScale (d),具体的结构对比示意图如下:

Paddle2.0:浅析并实现 CaiT 模型 - 创想鸟

作者建议的 LayerScale 是由每个残差块产生的向量的每通道相乘,而不是单个标量,见上图(d)。目标是将与同一输出通道相关联的权重的更新分组形式上,LayerScale 是在每个残差块的输出上乘以对角线矩阵,换言之,作者修改了上述的公式 1:

Paddle2.0:浅析并实现 CaiT 模型 - 创想鸟

其中 Paddle2.0:浅析并实现 CaiT 模型 - 创想鸟 和 Paddle2.0:浅析并实现 CaiT 模型 - 创想鸟 为可学习参数

ε 为对角线值的初始化值,一般为一个较小的数,作者设置为 ε=0.1 当深度小于等于 18 时,ε=10−5ε=10−5 当深度小于等于 24 时,和 ε=10−6ε=10−6 当深度大于 24 时

η 代表 LayerNorm

代码实现

class LayerScale_Block(nn.Layer):    # with slight modifications to add layerScale    def __init__(self, dim, num_heads, mlp_ratio=4., qkv_bias=False, qk_scale=None, drop=0., attn_drop=0.,                 drop_path=0., act_layer=nn.GELU, norm_layer=nn.LayerNorm, epsilon=1e-6,                 Attention_block=Attention_talking_head, Mlp_block=Mlp, init_values=1e-4):        super().__init__()        self.norm1 = norm_layer(dim, epsilon=epsilon)        self.attn = Attention_block(            dim,            num_heads=num_heads,            qkv_bias=qkv_bias,            qk_scale=qk_scale,            attn_drop=attn_drop,            proj_drop=drop        )        self.drop_path = DropPath(drop_path) if drop_path > 0. else Identity()        self.norm2 = norm_layer(dim, epsilon=epsilon)        mlp_hidden_dim = int(dim * mlp_ratio)        self.mlp = Mlp_block(            in_features=dim,            hidden_features=mlp_hidden_dim,            act_layer=act_layer,            drop=drop        )        # 创建 LayerScale 的两个可学习参数        # 使用 init_values 初始化这两个参数        self.gamma_1 = add_parameter(self, init_values * paddle.ones((dim,)))        self.gamma_2 = add_parameter(self, init_values * paddle.ones((dim,)))    def forward(self, x):        x = x + self.drop_path(self.gamma_1 * self.attn(self.norm1(x)))        x = x + self.drop_path(self.gamma_2 * self.mlp(self.norm2(x)))        return x

特别设计的类别注意力层

原理介绍

该设计旨在规避 ViT 体系结构的一个问题,学习的权重被要求优化两个矛盾的目标:引导 patch 之间的自注意总结信息对线性分类器有用作者建议是按照 Encoder-Decoder 体系结构的思想,显式地分离这两个阶段后置类别标记(Later class token):作者在 transformer 网络的中途添加 class token,这种选择消除了 transformer 第一层上的差异,因此完全用于在 patch 之间执行自注意在结构上 CaiT 网络由两个不同的处理阶段组成,如下图所示:self-attention stage 与 ViT 的 transformer 相同,但没有类嵌入 (CLS)class-attention stage 是一组层,它将一组 patch 嵌入到一个类嵌入 CLS 中,后者随后被提供给一个线性分类器

Paddle2.0:浅析并实现 CaiT 模型 - 创想鸟

代码实现

# Class Attention class Class_Attention(nn.Layer):    # with slight modifications to do CA    def __init__(self, dim, num_heads=8, qkv_bias=False,                  qk_scale=None, attn_drop=0., proj_drop=0.):        super().__init__()        self.num_heads = num_heads        head_dim = dim // num_heads        self.scale = qk_scale or head_dim ** -0.5        self.q = nn.Linear(dim, dim, bias_attr=qkv_bias)        self.k = nn.Linear(dim, dim, bias_attr=qkv_bias)        self.v = nn.Linear(dim, dim, bias_attr=qkv_bias)        self.attn_drop = nn.Dropout(attn_drop)        self.proj = nn.Linear(dim, dim)        self.proj_drop = nn.Dropout(proj_drop)    def forward(self, x):        # 输入是 [cls token, x]        # 输出是计算 attention 之后的 cls token        # 在多层堆叠的时候后面的 x 一直是不变的        B, N, C = x.shape                # query 只取 cls token        q = self.q(x[:, 0]).unsqueeze(1).reshape(            (B, 1, self.num_heads, C // self.num_heads)        ).transpose((0, 2, 1, 3))        k = self.k(x).reshape(            (B, N, self.num_heads, C // self.num_heads)        ).transpose((0, 2, 1, 3))        q = q * self.scale        v = self.v(x).reshape(            (B, N, self.num_heads, C // self.num_heads)        ).transpose((0, 2, 1, 3))        attn = q.matmul(k.transpose((0, 1, 3, 2)))        attn = nn.functional.softmax(attn, axis=-1)        attn = self.attn_drop(attn)        x_cls = (attn.matmul(v)).transpose((0, 2, 1, 3)).reshape((B, 1, C))        x_cls = self.proj(x_cls)        x_cls = self.proj_drop(x_cls)        return x_cls# 结合 LayerScale 和 Class Attentionclass LayerScale_Block_CA(nn.Layer):    # with slight modifications to add CA and LayerScale    def __init__(self, dim, num_heads, mlp_ratio=4., qkv_bias=False, qk_scale=None, drop=0., attn_drop=0.,                 drop_path=0., act_layer=nn.GELU, norm_layer=nn.LayerNorm, epsilon=1e-6,                 Attention_block=Class_Attention, Mlp_block=Mlp, init_values=1e-4):        super().__init__()        self.norm1 = norm_layer(dim, epsilon=epsilon)        self.attn = Attention_block(            dim,             num_heads=num_heads,             qkv_bias=qkv_bias,             qk_scale=qk_scale,             attn_drop=attn_drop,             proj_drop=drop        )        self.drop_path = DropPath(drop_path) if drop_path > 0. else Identity()        self.norm2 = norm_layer(dim, epsilon=epsilon)        mlp_hidden_dim = int(dim * mlp_ratio)        self.mlp = Mlp_block(            in_features=dim,             hidden_features=mlp_hidden_dim,             act_layer=act_layer,             drop=drop        )        self.gamma_1 = add_parameter(self, init_values * paddle.ones((dim,)))        self.gamma_2 = add_parameter(self, init_values * paddle.ones((dim,)))    def forward(self, x, x_cls):        # 拼接 cls token 和 输入        u = paddle.concat((x_cls, x), axis=1)                # Class Attention + FFN        x_cls = x_cls + self.drop_path(self.gamma_1 * self.attn(self.norm1(u)))        x_cls = x_cls + self.drop_path(self.gamma_2 * self.mlp(self.norm2(x_cls)))        return x_cls

模型搭建

上面介绍了 CaiT 模型的一些重要的改进点接下来就完整地搭建一下模型

模型组网

In [ ]

import paddleimport paddle.nn as nnfrom common import add_parameterfrom common import trunc_normal_, zeros_, ones_from common import DropPath, Identity, Mlp, PatchEmbedclass Class_Attention(nn.Layer):    # with slight modifications to do CA    def __init__(self, dim, num_heads=8, qkv_bias=False,                 qk_scale=None, attn_drop=0., proj_drop=0.):        super().__init__()        self.num_heads = num_heads        head_dim = dim // num_heads        self.scale = qk_scale or head_dim ** -0.5        self.q = nn.Linear(dim, dim, bias_attr=qkv_bias)        self.k = nn.Linear(dim, dim, bias_attr=qkv_bias)        self.v = nn.Linear(dim, dim, bias_attr=qkv_bias)        self.attn_drop = nn.Dropout(attn_drop)        self.proj = nn.Linear(dim, dim)        self.proj_drop = nn.Dropout(proj_drop)    def forward(self, x):        B, N, C = x.shape        q = self.q(x[:, 0]).unsqueeze(1).reshape(            (B, 1, self.num_heads, C // self.num_heads)        ).transpose((0, 2, 1, 3))        k = self.k(x).reshape(            (B, N, self.num_heads, C // self.num_heads)        ).transpose((0, 2, 1, 3))        q = q * self.scale        v = self.v(x).reshape(            (B, N, self.num_heads, C // self.num_heads)        ).transpose((0, 2, 1, 3))        attn = q.matmul(k.transpose((0, 1, 3, 2)))        attn = nn.functional.softmax(attn, axis=-1)        attn = self.attn_drop(attn)        x_cls = (attn.matmul(v)).transpose((0, 2, 1, 3)).reshape((B, 1, C))        x_cls = self.proj(x_cls)        x_cls = self.proj_drop(x_cls)        return x_clsclass LayerScale_Block_CA(nn.Layer):    # with slight modifications to add CA and LayerScale    def __init__(self, dim, num_heads, mlp_ratio=4., qkv_bias=False, qk_scale=None, drop=0., attn_drop=0.,                 drop_path=0., act_layer=nn.GELU, norm_layer=nn.LayerNorm, epsilon=1e-6,                 Attention_block=Class_Attention, Mlp_block=Mlp, init_values=1e-4):        super().__init__()        self.norm1 = norm_layer(dim, epsilon=epsilon)        self.attn = Attention_block(            dim,             num_heads=num_heads,             qkv_bias=qkv_bias,             qk_scale=qk_scale,             attn_drop=attn_drop,             proj_drop=drop        )        self.drop_path = DropPath(drop_path) if drop_path > 0. else Identity()        self.norm2 = norm_layer(dim, epsilon=epsilon)        mlp_hidden_dim = int(dim * mlp_ratio)        self.mlp = Mlp_block(            in_features=dim,             hidden_features=mlp_hidden_dim,             act_layer=act_layer,             drop=drop        )        self.gamma_1 = add_parameter(self, init_values * paddle.ones((dim,)))        self.gamma_2 = add_parameter(self, init_values * paddle.ones((dim,)))    def forward(self, x, x_cls):        u = paddle.concat((x_cls, x), axis=1)        x_cls = x_cls + self.drop_path(self.gamma_1 * self.attn(self.norm1(u)))        x_cls = x_cls + self.drop_path(self.gamma_2 * self.mlp(self.norm2(x_cls)))        return x_clsclass Attention_talking_head(nn.Layer):    # with slight modifications to add Talking Heads Attention (https://arxiv.org/pdf/2003.02436v1.pdf)    def __init__(self, dim, num_heads=8, qkv_bias=False,                 qk_scale=None, attn_drop=0., proj_drop=0.):        super().__init__()        self.num_heads = num_heads        head_dim = dim // num_heads        self.scale = qk_scale or head_dim ** -0.5        self.qkv = nn.Linear(dim, dim * 3, bias_attr=qkv_bias)        self.attn_drop = nn.Dropout(attn_drop)        self.proj = nn.Linear(dim, dim)        self.proj_l = nn.Linear(num_heads, num_heads)        self.proj_w = nn.Linear(num_heads, num_heads)        self.proj_drop = nn.Dropout(proj_drop)    def forward(self, x):        B, N, C = x.shape        qkv = self.qkv(x).reshape(            (B, N, 3, self.num_heads, C // self.num_heads)        ).transpose((2, 0, 3, 1, 4))        q, k, v = qkv[0] * self.scale, qkv[1], qkv[2]        attn = (q.matmul(k.transpose((0, 1, 3, 2))))        attn = self.proj_l(attn.transpose((0, 2, 3, 1))).transpose((0, 3, 1, 2))        attn = nn.functional.softmax(attn, axis=-1)        attn = self.proj_w(attn.transpose((0, 2, 3, 1))).transpose((0, 3, 1, 2))        attn = self.attn_drop(attn)        x = (attn.matmul(v)).transpose((0, 2, 1, 3)).reshape((B, N, C))        x = self.proj(x)        x = self.proj_drop(x)        return xclass LayerScale_Block(nn.Layer):    # with slight modifications to add layerScale    def __init__(self, dim, num_heads, mlp_ratio=4., qkv_bias=False, qk_scale=None, drop=0., attn_drop=0.,                 drop_path=0., act_layer=nn.GELU, norm_layer=nn.LayerNorm, epsilon=1e-6,                 Attention_block=Attention_talking_head, Mlp_block=Mlp, init_values=1e-4):        super().__init__()        self.norm1 = norm_layer(dim, epsilon=epsilon)        self.attn = Attention_block(            dim,             num_heads=num_heads,             qkv_bias=qkv_bias,             qk_scale=qk_scale,             attn_drop=attn_drop,             proj_drop=drop        )        self.drop_path = DropPath(drop_path) if drop_path > 0. else Identity()        self.norm2 = norm_layer(dim, epsilon=epsilon)        mlp_hidden_dim = int(dim * mlp_ratio)        self.mlp = Mlp_block(            in_features=dim,             hidden_features=mlp_hidden_dim,             act_layer=act_layer,             drop=drop        )        self.gamma_1 = add_parameter(self, init_values * paddle.ones((dim,)))        self.gamma_2 = add_parameter(self, init_values * paddle.ones((dim,)))    def forward(self, x):        x = x + self.drop_path(self.gamma_1 * self.attn(self.norm1(x)))        x = x + self.drop_path(self.gamma_2 * self.mlp(self.norm2(x)))        return xclass CaiT(nn.Layer):    # with slight modifications to adapt to our cait models    def __init__(self, img_size=224, patch_size=16, in_chans=3, embed_dim=768, depth=12,                 num_heads=12, mlp_ratio=4, qkv_bias=True, qk_scale=None, drop_rate=0.,                 attn_drop_rate=0., drop_path_rate=0., norm_layer=nn.LayerNorm, epsilon=1e-6,                 block_layers=LayerScale_Block, block_layers_token=LayerScale_Block_CA,                 Patch_layer=PatchEmbed, act_layer=nn.GELU, Attention_block=Attention_talking_head,                 Mlp_block=Mlp, init_scale=1e-4, Attention_block_token_only=Class_Attention,                 Mlp_block_token_only=Mlp, depth_token_only=2, mlp_ratio_clstk=4.0, class_dim=1000):        super().__init__()        self.class_dim = class_dim        self.num_features = self.embed_dim = embed_dim        self.patch_embed = Patch_layer(            img_size=img_size,             patch_size=patch_size,             in_chans=in_chans,             embed_dim=embed_dim        )        num_patches = self.patch_embed.num_patches        self.cls_token = add_parameter(self, paddle.zeros((1, 1, embed_dim)))        self.pos_embed = add_parameter(self, paddle.zeros((1, num_patches, embed_dim)))        self.pos_drop = nn.Dropout(p=drop_rate)        dpr = [drop_path_rate for i in range(depth)]        self.blocks = nn.LayerList([            block_layers(                dim=embed_dim, num_heads=num_heads, mlp_ratio=mlp_ratio, qkv_bias=qkv_bias, qk_scale=qk_scale,                drop=drop_rate, attn_drop=attn_drop_rate, drop_path=dpr[i], norm_layer=norm_layer, epsilon=epsilon,                act_layer=act_layer, Attention_block=Attention_block, Mlp_block=Mlp_block, init_values=init_scale            ) for i in range(depth)        ])        self.blocks_token_only = nn.LayerList([            block_layers_token(                dim=embed_dim, num_heads=num_heads, mlp_ratio=mlp_ratio_clstk, qkv_bias=qkv_bias, qk_scale=qk_scale,                drop=0.0, attn_drop=0.0, drop_path=0.0, norm_layer=norm_layer, epsilon=epsilon, act_layer=act_layer,                 Attention_block=Attention_block_token_only, Mlp_block=Mlp_block_token_only, init_values=init_scale            ) for i in range(depth_token_only)        ])        self.norm = norm_layer(embed_dim, epsilon=epsilon)        # Classifier head        if class_dim > 0:            self.head = nn.Linear(embed_dim, class_dim)        trunc_normal_(self.pos_embed)        trunc_normal_(self.cls_token)        self.apply(self._init_weights)    def _init_weights(self, m):        if isinstance(m, nn.Linear):            trunc_normal_(m.weight)            if isinstance(m, nn.Linear) and m.bias is not None:                zeros_(m.bias)        elif isinstance(m, nn.LayerNorm):            zeros_(m.bias)            ones_(m.weight)    def forward_features(self, x):        B = x.shape[0]        x = self.patch_embed(x)        cls_tokens = self.cls_token.expand((B, -1, -1))        x = x + self.pos_embed        x = self.pos_drop(x)        for i, blk in enumerate(self.blocks):            x = blk(x)        for i, blk in enumerate(self.blocks_token_only):            cls_tokens = blk(x, cls_tokens)        x = paddle.concat((cls_tokens, x), axis=1)        x = self.norm(x)        return x[:, 0]    def forward(self, x):        x = self.forward_features(x)        if self.class_dim > 0:            x = self.head(x)        return x
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddle/fluid/layers/utils.py:26: DeprecationWarning: `np.int` is a deprecated alias for the builtin `int`. To silence this warning, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you wish to review your current use, check the release note link for additional information.Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations  def convert_to_list(value, n, name, dtype=np.int):

预设模型

In [ ]

def cait_xxs_24(pretrained=False, **kwargs):    model = CaiT(        img_size=224, embed_dim=192, depth=24,        num_heads=4, init_scale=1e-5, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_XXS24_224.pdparams')        model.set_dict(params)    return modeldef cait_xxs_36(pretrained=False, **kwargs):    model = CaiT(        img_size=224, embed_dim=192, depth=36,        num_heads=4, init_scale=1e-5, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_XXS36_224.pdparams')        model.set_dict(params)            return modeldef cait_s_24(pretrained=False, **kwargs):    model = CaiT(        img_size=224, embed_dim=384, depth=24,        num_heads=8, init_scale=1e-5, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_S24_224.pdparams')        model.set_dict(params)            return modeldef cait_xxs_24_384(pretrained=False, **kwargs):    model = CaiT(        img_size=384, embed_dim=192, depth=24,        num_heads=4, init_scale=1e-5, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_XXS24_384.pdparams')        model.set_dict(params)            return modeldef cait_xxs_36_384(pretrained=False, **kwargs):    model = CaiT(        img_size=384, embed_dim=192, depth=36,        num_heads=4, init_scale=1e-5, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_XXS36_384.pdparams')        model.set_dict(params)            return modeldef cait_xs_24_384(pretrained=False, **kwargs):    model = CaiT(        img_size=384, embed_dim=288, depth=24,        num_heads=6, init_scale=1e-5, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_XS24_384.pdparams')        model.set_dict(params)            return modeldef cait_s_24_384(pretrained=False, **kwargs):    model = CaiT(        img_size=384, embed_dim=384, depth=24,        num_heads=8, init_scale=1e-5, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_S24_384.pdparams')        model.set_dict(params)            return modeldef cait_s_36_384(pretrained=False, **kwargs):    model = CaiT(        img_size=384, embed_dim=384, depth=36,        num_heads=8, init_scale=1e-6, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_S36_384.pdparams')        model.set_dict(params)            return modeldef cait_m_36_384(pretrained=False, **kwargs):    model = CaiT(        img_size=384, embed_dim=768, depth=36,        num_heads=16, init_scale=1e-6, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_M36_384.pdparams')        model.set_dict(params)            return modeldef cait_m_48_448(pretrained=False, **kwargs):    model = CaiT(        img_size=448, embed_dim=768, depth=48,        num_heads=16, init_scale=1e-6, **kwargs)    if pretrained:        params = paddle.load('data/data82724/CaiT_M48_448.pdparams')        model.set_dict(params)            return model

模型测试

In [ ]

model = cait_xxs_24(True)random_input = paddle.randn((1, 3, 224, 224))out = model(random_input)print(out.shape)model.eval()out = model(random_input)print(out.shape)
[1, 1000][1, 1000]

精度验证

官方的论文标称精度如下:

Paddle2.0:浅析并实现 CaiT 模型 - 创想鸟

解压数据集

In [ ]

!mkdir ~/data/ILSVRC2012!tar -xf ~/data/data68594/ILSVRC2012_img_val.tar -C ~/data/ILSVRC2012

模型验证

In [11]

import osimport cv2import numpy as npimport paddleimport paddle.vision.transforms as Tfrom PIL import Image# 构建数据集class ILSVRC2012(paddle.io.Dataset):    def __init__(self, root, label_list, transform, backend='pil'):        self.transform = transform        self.root = root        self.label_list = label_list        self.backend = backend        self.load_datas()    def load_datas(self):        self.imgs = []        self.labels = []        with open(self.label_list, 'r') as f:            for line in f:                img, label = line[:-1].split(' ')                self.imgs.append(os.path.join(self.root, img))                self.labels.append(int(label))    def __getitem__(self, idx):        label = self.labels[idx]        image = self.imgs[idx]        if self.backend=='cv2':            image = cv2.imread(image)        else:            image = Image.open(image).convert('RGB')        image = self.transform(image)        return image.astype('float32'), np.array(label).astype('int64')    def __len__(self):        return len(self.imgs)val_transforms = T.Compose([    T.Resize(448, interpolation='bicubic'),    T.CenterCrop(448),    T.ToTensor(),    T.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])])# 配置模型model = cait_m_48_448(pretrained=True)model = paddle.Model(model)model.prepare(metrics=paddle.metric.Accuracy(topk=(1, 5)))# 配置数据集val_dataset = ILSVRC2012('data/ILSVRC2012', transform=val_transforms, label_list='data/data68594/val_list.txt', backend='pil')# 模型验证acc = model.evaluate(val_dataset, batch_size=64, num_workers=0, verbose=1)print(acc)
{'acc_top1': 0.86492, 'acc_top5': 0.97752}

以上就是Paddle2.0:浅析并实现 CaiT 模型的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/66780.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月12日 08:30:53
下一篇 2025年11月12日 08:55:41

相关推荐

  • Uniapp 中如何不拉伸不裁剪地展示图片?

    灵活展示图片:如何不拉伸不裁剪 在界面设计中,常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。 对于不同尺寸的图片,可以采用以下处理方式: 极端宽高比:撑满屏幕宽度或高度,再等比缩放居中。非极端宽高比:居中显示,若能撑满则撑满。 然而,如果需要不拉伸不…

    2025年12月24日
    400
  • 如何让小说网站控制台显示乱码,同时网页内容正常显示?

    如何在不影响用户界面的情况下实现控制台乱码? 当在小说网站上下载小说时,大家可能会遇到一个问题:网站上的文本在网页内正常显示,但是在控制台中却是乱码。如何实现此类操作,从而在不影响用户界面(UI)的情况下保持控制台乱码呢? 答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体,并通过在客户端…

    2025年12月24日
    800
  • 如何在地图上轻松创建气泡信息框?

    地图上气泡信息框的巧妙生成 地图上气泡信息框是一种常用的交互功能,它简便易用,能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。 利用地图库的原生功能 大多数地图库,如高德地图,都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现: 高德地图 JS API 参考文…

    2025年12月24日
    400
  • 如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画?

    如何实现元素scrollleft变化时的平滑动画效果? 在许多网页应用中,滚动容器的水平滚动条(scrollleft)需要频繁使用。为了让滚动动作更加自然,你希望给scrollleft的变化添加动画效果。 解决方案:scroll-behavior 属性 要实现scrollleft变化时的平滑动画效果…

    2025年12月24日
    000
  • 如何为滚动元素添加平滑过渡,使滚动条滑动时更自然流畅?

    给滚动元素平滑过渡 如何在滚动条属性(scrollleft)发生改变时为元素添加平滑的过渡效果? 解决方案:scroll-behavior 属性 为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码: click the button to slide right!…

    2025年12月24日
    500
  • 如何选择元素个数不固定的指定类名子元素?

    灵活选择元素个数不固定的指定类名子元素 在网页布局中,有时需要选择特定类名的子元素,但这些元素的数量并不固定。例如,下面这段 html 代码中,activebar 和 item 元素的数量均不固定: *n *n 如果需要选择第一个 item元素,可以使用 css 选择器 :nth-child()。该…

    2025年12月24日
    200
  • 使用 SVG 如何实现自定义宽度、间距和半径的虚线边框?

    使用 svg 实现自定义虚线边框 如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片,但是这种方法存在引入外部资源、性能低下的缺点。 为了避免上述问题,可以使用 svg(可缩放矢量图形)来创建纯代码实现。一种方…

    2025年12月24日
    100
  • 如何解决本地图片在使用 mask JS 库时出现的跨域错误?

    如何跨越localhost使用本地图片? 问题: 在本地使用mask js库时,引入本地图片会报跨域错误。 解决方案: 要解决此问题,需要使用本地服务器启动文件,以http或https协议访问图片,而不是使用file://协议。例如: python -m http.server 8000 然后,可以…

    2025年12月24日
    200
  • 如何让“元素跟随文本高度,而不是撑高父容器?

    如何让 元素跟随文本高度,而不是撑高父容器 在页面布局中,经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中,父容器被较高的图片撑开,而文本的高度没有被考虑。本问答将提供纯css解决方案,让图片跟随文本高度,确保父容器的高度不会被图片影响。 解决方法 为了解决这个问题,需要将图片从文档流中脱离…

    2025年12月24日
    000
  • 为什么 CSS mask 属性未请求指定图片?

    解决 css mask 属性未请求图片的问题 在使用 css mask 属性时,指定了图片地址,但网络面板显示未请求获取该图片,这可能是由于浏览器兼容性问题造成的。 问题 如下代码所示: 立即学习“前端免费学习笔记(深入)”; icon [data-icon=”cloud”] { –icon-cl…

    2025年12月24日
    200
  • 如何利用 CSS 选中激活标签并影响相邻元素的样式?

    如何利用 css 选中激活标签并影响相邻元素? 为了实现激活标签影响相邻元素的样式需求,可以通过 :has 选择器来实现。以下是如何具体操作: 对于激活标签相邻后的元素,可以在 css 中使用以下代码进行设置: li:has(+li.active) { border-radius: 0 0 10px…

    2025年12月24日
    100
  • 如何模拟Windows 10 设置界面中的鼠标悬浮放大效果?

    win10设置界面的鼠标移动显示周边的样式(探照灯效果)的实现方式 在windows设置界面的鼠标悬浮效果中,光标周围会显示一个放大区域。在前端开发中,可以通过多种方式实现类似的效果。 使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

    2025年12月24日
    200
  • 为什么我的 Safari 自定义样式表在百度页面上失效了?

    为什么在 Safari 中自定义样式表未能正常工作? 在 Safari 的偏好设置中设置自定义样式表后,您对其进行测试却发现效果不同。在您自己的网页中,样式有效,而在百度页面中却失效。 造成这种情况的原因是,第一个访问的项目使用了文件协议,可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

    2025年12月24日
    000
  • 如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果?

    如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果 想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果,可以通过以下途径: CSS 解决方案 DEMO 1: Windows 10 网格悬停效果:https://codepen.io/tr4553r7/pe…

    2025年12月24日
    000
  • 使用CSS mask属性指定图片URL时,为什么浏览器无法加载图片?

    css mask属性未能加载图片的解决方法 使用css mask属性指定图片url时,如示例中所示: mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是,在网络面板中却…

    2025年12月24日
    000
  • 如何用CSS Paint API为网页元素添加时尚的斑马线边框?

    为元素添加时尚的斑马线边框 在网页设计中,有时我们需要添加时尚的边框来提升元素的视觉效果。其中,斑马线边框是一种既醒目又别致的设计元素。 实现斜向斑马线边框 要实现斜向斑马线间隔圆环,我们可以使用css paint api。该api提供了强大的功能,可以让我们在元素上绘制复杂的图形。 立即学习“前端…

    2025年12月24日
    000
  • 图片如何不撑高父容器?

    如何让图片不撑高父容器? 当父容器包含不同高度的子元素时,父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开,避免图片对其产生影响,可以通过以下 css 解决方法: 绝对定位元素: .child-image { position: absolute; top: 0; left: …

    2025年12月24日
    000
  • 使用 Mask 导入本地图片时,如何解决跨域问题?

    跨域疑难:如何解决 mask 引入本地图片产生的跨域问题? 在使用 mask 导入本地图片时,你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢?让我们深入了解一下: mask 框架假设你以 http(s) 协议加载你的 html 文件,而当使用 file:// 协议打开本地文件时,就会产生跨域…

    2025年12月24日
    200
  • CSS 帮助

    我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

    2025年12月24日 好文分享
    200
  • 前端代码辅助工具:如何选择最可靠的AI工具?

    前端代码辅助工具:可靠性探讨 对于前端工程师来说,在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而,并非所有工具都能提供同等的可靠性。 个性化需求 关于哪个AI工具最可靠,这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素: 立…

    2025年12月24日
    300

发表回复

登录后才能评论
关注微信