精品www日韩熟女人妻,久久99青青精品免费观看,精品无码国产一区二区三区麻豆

訓(xùn)練閃豚Pro模型過程中，數(shù)據(jù)集的數(shù)量和學(xué)習(xí)率的關(guān)系

閃豚AI — Thu, 14 Nov 2024 11:19:19 +0000

在訓(xùn)練閃豚速寫Pro模型時(shí)，學(xué)習(xí)率的選擇是一個(gè)關(guān)鍵的超參數(shù)，它會(huì)顯著影響模型的收斂速度和最終效果。

我們默認(rèn)使用的是5e-5，這個(gè)學(xué)習(xí)率是一個(gè)常見的默認(rèn)值，但不確保適合所有行業(yè)數(shù)據(jù)或數(shù)據(jù)量的大小，更好的學(xué)習(xí)率則要根據(jù)數(shù)據(jù)集的大小、訓(xùn)練目標(biāo)、優(yōu)化器的選擇等因素來(lái)調(diào)整。

學(xué)習(xí)率與數(shù)據(jù)集大小的關(guān)系

一般來(lái)說，隨著訓(xùn)練數(shù)據(jù)集的增大，可以使用稍微較高的學(xué)習(xí)率，因?yàn)楦嗟臄?shù)據(jù)有助于模型更穩(wěn)健地學(xué)習(xí)，從而能夠承受更大的學(xué)習(xí)率而不容易出現(xiàn)震蕩。反之，數(shù)據(jù)集較小時(shí)，較小的學(xué)習(xí)率可以幫助模型穩(wěn)定收斂，避免過擬合或損失函數(shù)波動(dòng)較大。

通?？梢宰裱韵乱恍┙?jīng)驗(yàn)法則來(lái)設(shè)置學(xué)習(xí)率：

較小的數(shù)據(jù)集（< 10萬(wàn)條）：
- 學(xué)習(xí)率一般會(huì)選擇較小的值，比如5e-5或3e-5。這有助于模型在小數(shù)據(jù)集上穩(wěn)定訓(xùn)練，避免過度擬合。
中等大小的數(shù)據(jù)集（10萬(wàn)-50萬(wàn)條）：
- 學(xué)習(xí)率可以稍微提高，比如選擇5e-5或6e-5。在這種規(guī)模的數(shù)據(jù)集上，模型有足夠的樣本來(lái)學(xué)習(xí)復(fù)雜的模式，但學(xué)習(xí)率不宜過大，以免錯(cuò)過最優(yōu)解。
大規(guī)模數(shù)據(jù)集（> 100萬(wàn)條）：
- 對(duì)于非常大的數(shù)據(jù)集，可以考慮稍微增加學(xué)習(xí)率到7e-5或1e-4，或者使用學(xué)習(xí)率調(diào)度（如warm-up策略）來(lái)逐步提高學(xué)習(xí)率，確保模型能有效收斂。

最好通過實(shí)驗(yàn)多次訓(xùn)練同一批數(shù)據(jù)來(lái)驗(yàn)證學(xué)習(xí)率的選擇，采用交叉驗(yàn)證等方法來(lái)找到最適合你數(shù)據(jù)集和任務(wù)的學(xué)習(xí)率。

【更新】【收費(fèi)工具】自定義關(guān)鍵詞提取批量生成數(shù)據(jù)表

閃豚AI — Wed, 08 Nov 2023 17:07:06 +0000

本工具與商城內(nèi)的“自定義關(guān)鍵詞提取批量生成數(shù)據(jù)表”是一樣的工具，請(qǐng)不要重復(fù)購(gòu)買使用，在這個(gè)帖子鏈接內(nèi)購(gòu)買了，就不要在商城里面購(gòu)買，如果在商城里面購(gòu)買了，就不要在這里購(gòu)買。

目前版本：自定義關(guān)鍵詞提取批量生成數(shù)據(jù)表1.4

修復(fù)了百度知道最新反爬機(jī)制

更新時(shí)間：2023-11-9

該工具已更新為單獨(dú)的EXE程序。

主要作用：根據(jù)自己整理的關(guān)鍵詞或者長(zhǎng)尾詞，讓程序通過爬蟲提取標(biāo)題和起始句。而不是提取原始語(yǔ)料的數(shù)據(jù)了。

如果速度過快，容易被屏蔽，然后就會(huì)停止了，建議加上代理。代理使用“隧道代理，最好每次請(qǐng)求更換IP”

如果使用代理的話，需要將代理開關(guān)打開，在配置文件里面的代理設(shè)置，把False改成True。

True為使用代理，F(xiàn)alse為不使用代理。

如果啟用代理的話，需要?jiǎng)h掉代理配置中的雙引號(hào)：

【新增更新】新增已處理記憶功能，中斷運(yùn)行后，不會(huì)重復(fù)提取已提取的數(shù)據(jù)。

【9-11新增更新】：優(yōu)化程序爬取邏輯

聲明：由于此工具并非AI項(xiàng)目配套必須品（我們項(xiàng)目有自帶的提取標(biāo)題和起始句的工具），此工具只為拓展協(xié)助你提取你自定義的數(shù)據(jù)，提升使用者的方便，所以本工具需另收費(fèi)。本工具僅限用于我們AI-CPM批量生成功能。

暫定價(jià)格：168元（買斷制）

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

登錄后免費(fèi)下載登錄小黑屋反思中，不準(zhǔn)下載！評(píng)論后刷新頁(yè)面下載評(píng)論支付以后下載請(qǐng)先登錄您今天的下載次數(shù)（次）用完了，請(qǐng)明天再來(lái) 支付積分以后下載立即支付支付以后下載立即支付您當(dāng)前的用戶組不允許下載升級(jí)會(huì)員

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚速寫使用過程報(bào)錯(cuò)/閃退的問題處理解決辦法合集

閃豚AI — Mon, 06 Nov 2023 00:04:01 +0000

問題一：預(yù)載模型不完整。

OSError: Unable to load weights from pytorch checkpoint file for  '
C:\...\Stdownload\train_model\pytorch_model.bin' at '
C:\...\Stdownload\train_model\pytorch_model.bin'. 
If you tried to load a PyTorch model from a TF 2.0 checkpoint, please set from_tf=True.

如果剛開始點(diǎn)擊訓(xùn)練，就報(bào)錯(cuò)遇到這種，看到：Stdownload\train_model\pytorch_model.bin這個(gè)字段，就說明是預(yù)載模型不完整。

解決方案：使用官網(wǎng)緩存清理工具，對(duì)閃豚軟件全面的清理緩存，重新從中央驗(yàn)證服務(wù)器預(yù)載模型權(quán)重。

工具下載地址：http://yunzou.com.cn/app/69618.html

問題二：顯存不足導(dǎo)致的閃退或終止訓(xùn)練報(bào)錯(cuò)。

【閃豚Ai】訓(xùn)練出錯(cuò)319！錯(cuò)誤信息：
CUDA out of memory. Tried to allocate 12.00 MiB 
(GPU 0; 23.99 GiB total capacity; 11.95 GiB already allocated; 10.36 GiB free; 11.96 GiB reserved in total by PyTorch)

當(dāng)看到報(bào)錯(cuò)信息：CUDA out of memory.等關(guān)鍵信息，就說明是顯存不足導(dǎo)致的。

顯存不足導(dǎo)致的原因有很多，不好解決，可能是其他應(yīng)用占用，也有可能是顯卡的CUDA驅(qū)動(dòng)，沒來(lái)得及自己清理緩存，導(dǎo)致模型訓(xùn)練的時(shí)候，緩存得不到釋放，就導(dǎo)致顯存不足，訓(xùn)練終止了。

初步解決方案一：

初始訓(xùn)練的時(shí)候，用強(qiáng)制清理JSON工具，清理一遍你的訓(xùn)練JSON數(shù)據(jù)文件。

工具下載：http://yunzou.com.cn/app/69557.html

初步解決方案二：

訓(xùn)練界面中，默認(rèn)Max_len參數(shù)是：900，可以調(diào)整更小，比如800,700。

初步解決方案三：

save_steps參數(shù)和logging_steps參數(shù)不要設(shè)置太大，保持默認(rèn)10000即可。過多的模型生成出來(lái)，可以手動(dòng)刪除舊的模型文件夾，保留最新的3~5個(gè)模型文件夾即可?；蛘叩认到y(tǒng)默認(rèn)會(huì)根據(jù)硬盤設(shè)置的大小自動(dòng)刪除舊的模型。

問題三：繼續(xù)訓(xùn)練剛開始的報(bào)錯(cuò)。

【閃豚Ai】訓(xùn)練出錯(cuò)319！錯(cuò)誤信息：
Unable to load weights from pytorch checkpoint file for '
.../checkpoint-xxxxx\pytorch_model.bin' 
at '.../checkpoint-xxxxx\pytorch_model.bin'. 
If you tried to load a PyTorch model from a TF 2.0 checkpoint, please set from_tf=True.

checkpoint-xxxxx：后面的XXX代表的是數(shù)字。

當(dāng)繼續(xù)訓(xùn)練，遇到報(bào)錯(cuò)信息是：.../checkpoint-xxxxx\pytorch_model.bin，說明這個(gè)模型損壞，需要?jiǎng)h除這個(gè)模型，再重新繼續(xù)訓(xùn)練即可。

原因是：沒有在這個(gè)模型文件夾下，找到可用完整的模型和可繼續(xù)訓(xùn)練的記憶模型。

問題四：繼續(xù)訓(xùn)練卻提醒模型訓(xùn)練完成

當(dāng)繼續(xù)訓(xùn)練的時(shí)候，卻沒達(dá)到最終步數(shù)，卻提示“模型訓(xùn)練完成”，這個(gè)是因?yàn)?，模型機(jī)制判定問題，因?yàn)榻咏詈蟮挠?xùn)練次數(shù)，沒有完整的一個(gè)Epoch輪次，所以會(huì)提醒“模型訓(xùn)練完成”。

解決方法：增大你的訓(xùn)練次數(shù)，就可以解決。比如原本是10次，繼續(xù)訓(xùn)練的時(shí)候提醒“模型訓(xùn)練完成”，則你可以增加到15次，20次。

其他訓(xùn)練報(bào)錯(cuò)問題，后續(xù)完善補(bǔ)充

生成過程中遇到的報(bào)錯(cuò)問題

生成問題一：list index out of range

批量生成中，當(dāng)點(diǎn)擊生成后，出現(xiàn)：

[閃豚Ai] 生成出錯(cuò)，數(shù)據(jù)標(biāo)題: xxxxx!錯(cuò)誤信息: list index out of range

說明是你的生成數(shù)據(jù)表沒按標(biāo)準(zhǔn)處理，標(biāo)準(zhǔn)的生成數(shù)據(jù)表如下格式：

每行一條數(shù)據(jù)，前面是標(biāo)題，### 號(hào)后是正文的起始句。

生成問題二：點(diǎn)擊生成后，就閃退

遇到這個(gè)問題，80%是因?yàn)槟隳Ｐ吐窂接兄形?，一定要切記，模型路徑不能有中文，把中文改成拼音或者其他英文即可解決。

生成問題三：生成一段時(shí)間后，閃退

百分之八十也是因?yàn)轱@存不足，當(dāng)你開了多個(gè)生成任務(wù)，每個(gè)生成任務(wù)會(huì)占用4~6G左右的顯存，顯存的占用也會(huì)隨著字?jǐn)?shù)的長(zhǎng)短而變化。如果多個(gè)生成任務(wù)，開了一段時(shí)間后，就閃退了，基本就是顯存不足導(dǎo)致的。

減少生成任務(wù)窗口或者軟件的多開，就能解決。

建議是每一個(gè)生成任務(wù)單獨(dú)開一個(gè)軟件，避免使用軟件自帶的窗口1~5來(lái)生成，每單獨(dú)一個(gè)軟件生成，能更好的控制任務(wù)。

星座行業(yè)模型-13.8萬(wàn)學(xué)習(xí)語(yǔ)料，訓(xùn)練129萬(wàn)步

閃豚AI — Sat, 16 Sep 2023 15:13:16 +0000

2023年12月二次更新星座模型權(quán)重，優(yōu)化生成內(nèi)容輸出。已購(gòu)買的用戶重新去下載地址下載。

1.模型訓(xùn)練的硬件設(shè)備：3090

2.模型訓(xùn)練的時(shí)長(zhǎng)：120小時(shí)

3.模型訓(xùn)練的數(shù)據(jù)量：13.8萬(wàn)

4.模型訓(xùn)練的最終loss值：2.1

5.模型屬于什么行業(yè)內(nèi)容：星座內(nèi)容垂直行業(yè)

6.模型實(shí)際生成效果內(nèi)容展示：

模型生成的內(nèi)容，基本過AI檢測(cè)

點(diǎn)擊下載預(yù)覽生成內(nèi)容樣本：

https://wwvw.lanzouj.com/idlrn18qdv1g

7.明確模型出售價(jià)格：1100元

8.賣家需預(yù)留聯(lián)系信息：聯(lián)系官方客服

9.是否允許二次交易：不允許

10.上傳訓(xùn)練語(yǔ)料樣本：

語(yǔ)料樣本查看下載：

https://wwvw.lanzouj.com/iWnyD18oosqh

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚速寫Pro全功能版安裝包下載

閃豚AI — Thu, 07 Sep 2023 06:01:20 +0000

目前版本號(hào)：1.9.2

更新時(shí)間：2023-9-7

更新日志：http://yunzou.com.cn/updata-page

閃豚速寫Pro全功能版本安裝包

需要購(gòu)買后，才有權(quán)限下載和激活使用，沒購(gòu)買的話，請(qǐng)前往商城進(jìn)行購(gòu)買再使用。

點(diǎn)擊下方鏈接購(gòu)買終身版

閃豚速寫Pro[出售]

￥7800

庫(kù)存：116
人氣：6.3k

點(diǎn)擊下方鏈接購(gòu)按月訂閱版

閃豚速寫Pro-月卡[出售]

￥3200

庫(kù)存：9
人氣：174

更新公告，請(qǐng)自行前往更新公告專欄

閃豚項(xiàng)目更新記錄

閃豚速寫LE輕量版安裝包下載

閃豚AI — Thu, 07 Sep 2023 06:00:53 +0000

目前版本號(hào)：1.8.1

更新時(shí)間：2023-9-7

更新日志：http://yunzou.com.cn/updata-page

閃豚速寫LE輕量版安裝包，輕量版僅支持生成，不支持訓(xùn)練和數(shù)據(jù)處理等功能。

輕量版需要購(gòu)買模型才可以使用。

輕量版安裝包需要購(gòu)買后，才有權(quán)限下載和激活使用，沒購(gòu)買的話，請(qǐng)前往商城進(jìn)行購(gòu)買再使用。

點(diǎn)擊下方鏈接購(gòu)買輕量版

閃豚速寫-輕量版[出售]

￥1688

庫(kù)存：18
人氣：529

更推薦購(gòu)買全功能版本，閃豚速寫Pro

閃豚速寫Pro[出售]

￥7800

庫(kù)存：116
人氣：6.3k

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚速寫軟件推理生成功能中的參數(shù)調(diào)整說明教程

閃豚AI — Tue, 29 Aug 2023 16:11:16 +0000

很多用戶已經(jīng)使用上了推理，但是想要模型生成出來(lái)的質(zhì)量更好，需要根據(jù)自己的應(yīng)用場(chǎng)景和模型質(zhì)量進(jìn)行調(diào)參。

下面我們來(lái)講解一下這些參數(shù)的說明：

seqiences：表示生成的序列個(gè)數(shù)。如果設(shè)置為大于1的值，模型會(huì)生成指定數(shù)量的不同序列。這對(duì)于希望得到多種可能輸出的場(chǎng)景是有用的。

penalty：這個(gè)參數(shù)用于控制生成文本中的重復(fù)性。值越大，生成的文本中的重復(fù)內(nèi)容就越少。調(diào)整此參數(shù)可以影響生成文本的多樣性和唯一性。

top_k：在生成過程中，模型會(huì)在每個(gè)時(shí)間步驟為每個(gè)可能的下一個(gè)詞賦予一個(gè)分?jǐn)?shù)。top_k用于限制在每個(gè)時(shí)間步驟中，模型只考慮分?jǐn)?shù)最高的k個(gè)詞。如果top_k設(shè)置的太小，可能會(huì)導(dǎo)致生成的文本過于單一；設(shè)置的太大，可能導(dǎo)致生成的文本缺乏連貫性。

top_p：這也是一種限制模型考慮的可能下一個(gè)詞的方法，不同的是，它是基于分?jǐn)?shù)的累積概率而不是個(gè)數(shù)。即在每個(gè)時(shí)間步驟中，模型會(huì)考慮到使得下一個(gè)詞的分?jǐn)?shù)的累積概率超過top_p的最小集合。這種方法又被稱為nucleus sampling。它可以增加生成文本的多樣性。

調(diào)整這些參數(shù)可以影響生成的質(zhì)量。例如，適當(dāng)增大penalty可以減少生成文本中的重復(fù)；合理設(shè)置top_k和top_p可以影響生成文本的多樣性和連貫性。但需要注意的是，沒有一組適合所有場(chǎng)景的最優(yōu)參數(shù)，需要根據(jù)具體任務(wù)和數(shù)據(jù)進(jìn)行嘗試和調(diào)整。

字?jǐn)?shù)限制：請(qǐng)注意，該參數(shù)為內(nèi)容的生成最高字?jǐn)?shù)，如果覺得模型生成的字?jǐn)?shù)低，請(qǐng)調(diào)整該參數(shù)，比如，字?jǐn)?shù)限制是800，那么模型生成的字?jǐn)?shù)絕對(duì)不會(huì)超過800字。

字?jǐn)?shù)限制還有個(gè)問題請(qǐng)注意，模型的生成字?jǐn)?shù)長(zhǎng)度多少，取決于訓(xùn)練語(yǔ)料的字?jǐn)?shù)，如果您的訓(xùn)練語(yǔ)料字?jǐn)?shù)普遍只有三四百字，那么模型最終生成的字?jǐn)?shù)也是三四百字。標(biāo)準(zhǔn)模型則可以最高支持3倍以上的字?jǐn)?shù)生成。

最簡(jiǎn)單的調(diào)整參數(shù)教學(xué)：

penalty：你就把它看成，控制生成內(nèi)容的重復(fù)性的，減少它，則會(huì)讓內(nèi)容有更多重復(fù)的語(yǔ)句，詞語(yǔ)出現(xiàn)。

top_k：這個(gè)參數(shù)是調(diào)整生成的內(nèi)容的隨機(jī)性的，調(diào)整大，則會(huì)出現(xiàn)隨機(jī)性越大，越能拓展你的學(xué)習(xí)語(yǔ)料。調(diào)小則會(huì)更貼近你的訓(xùn)練樣本。

top_p：這個(gè)參數(shù)也是調(diào)整生成內(nèi)容的隨機(jī)性，只不過它是控制概率采樣的，也就是生成推理時(shí)候，預(yù)測(cè)下一個(gè)組詞命中我們模型詞典數(shù)據(jù)。

減少top_k并增加top_p參數(shù)值，模型的輸出會(huì)變得更有確定性，更接近它在訓(xùn)練數(shù)據(jù)中看到學(xué)習(xí)的內(nèi)容。

軟件操作教程：

生成數(shù)據(jù)表格式要求：

如果你只有關(guān)鍵詞，可以使用下面的工具進(jìn)行數(shù)據(jù)表轉(zhuǎn)換

工具下載鏈接：

http://yunzou.com.cn/app/75359.html

推薦使用完成的標(biāo)題和起始句（文章的第一句話），這種方式去引導(dǎo)模型生成內(nèi)容，質(zhì)量會(huì)更好。

閃豚速寫Pro全流程訓(xùn)練指導(dǎo)使用教程

閃豚AI — Tue, 29 Aug 2023 16:01:10 +0000

請(qǐng)注意：本文章教程，適用于閃豚速寫Pro訓(xùn)練。初次使用，請(qǐng)務(wù)必瀏覽本內(nèi)容進(jìn)行學(xué)習(xí)。

請(qǐng)注意：軟件安裝時(shí)，一定不要安裝默認(rèn)路徑C盤，C盤系統(tǒng)有權(quán)限問題會(huì)導(dǎo)致軟件出現(xiàn)異常！

兩個(gè)模型的區(qū)別：

	標(biāo)準(zhǔn)模型	Small模型
訓(xùn)練時(shí)長(zhǎng)	訓(xùn)練5輪左右就可用（訓(xùn)練越多越好）	訓(xùn)練30~50輪左右可用（訓(xùn)練越多越好）
訓(xùn)練要求	GPU顯存≥24GB	GPU顯存≥6GB
訓(xùn)練速度	3090每秒2~4條數(shù)據(jù)訓(xùn)練 4090每秒5~8條數(shù)據(jù)訓(xùn)練	3090每秒10~15條數(shù)據(jù)訓(xùn)練 4090每秒20~25條數(shù)據(jù)訓(xùn)練
模型超長(zhǎng)輸出能力	支持語(yǔ)料長(zhǎng)度3倍生成輸出（例如，原始語(yǔ)料1000字，模型能生成3000字）	對(duì)訓(xùn)練語(yǔ)料原始字?jǐn)?shù)生成超長(zhǎng)輸出不太好（例如，原始語(yǔ)料1000字，模型僅能生成1000字）
成品模型大小	成品模型大約在6Gb左右	成品模型大約在2Gb左右
知識(shí)訓(xùn)練能力	能承載百萬(wàn)級(jí)以上語(yǔ)料訓(xùn)練	僅承載50萬(wàn)級(jí)語(yǔ)料以下訓(xùn)練

對(duì)于模型的訓(xùn)練速度預(yù)測(cè)，可以使用官網(wǎng)在線計(jì)算器，根據(jù)你顯卡型號(hào)的CUDA數(shù)量進(jìn)行訓(xùn)練時(shí)間預(yù)估計(jì)算，在線計(jì)算器請(qǐng)點(diǎn)擊下方URL鏈接：

http://yunzou.com.cn/mdcalculator

一、軟件安裝工使用

軟件安裝使用，需要安裝CUDA驅(qū)動(dòng)以及安裝CUDNN提供訓(xùn)練加速。具體請(qǐng)參照以下文章教程，點(diǎn)擊跳轉(zhuǎn)。請(qǐng)務(wù)必按照教程中步驟，進(jìn)行驅(qū)動(dòng)安裝和CUDNN的安裝。

（請(qǐng)注意，CUDA驅(qū)動(dòng)是CUDA驅(qū)動(dòng)，顯卡驅(qū)動(dòng)是顯卡驅(qū)動(dòng)，請(qǐng)不要搞混淆。教程中最下面提供CUDA驅(qū)動(dòng)和CUDNN安裝包。自行下載根據(jù)教程流程安裝。）

【新手必看教程】閃豚速寫軟件安裝教程以及CUDA和CUDNN安裝教程

閃豚AI

23年6月8日
喜歡：7
瀏覽：685

二、軟件注冊(cè)激活

1、用戶注冊(cè)

打開軟件后，首先點(diǎn)擊用戶注冊(cè)按鈕，跳轉(zhuǎn)注冊(cè)頁(yè)面，按照要求進(jìn)行資料填寫，邀請(qǐng)碼可不用填寫。注冊(cè)完成后，會(huì)自動(dòng)跳轉(zhuǎn)“激活”頁(yè)面，輸入激活碼進(jìn)行激活即可使用。

2、軟件激活

在激活頁(yè)面中，需要輸入您注冊(cè)的用戶名和密碼以及激活卡號(hào)。點(diǎn)擊激活即可。

（請(qǐng)注意：無(wú)需填寫充值卡密碼）

獲得的激活碼，一共有三次綁定/兩次解綁換綁服務(wù)，超出后每次收取500元服務(wù)費(fèi)（僅支持同一IP段換綁，非同IP段換綁則需新購(gòu)）

三、數(shù)據(jù)處理

1、數(shù)據(jù)的準(zhǔn)備

閃豚速寫Pro訓(xùn)練語(yǔ)料數(shù)據(jù)要求如下：

每篇學(xué)習(xí)語(yǔ)料以TXT文件形式保存，文件名推薦使用內(nèi)容的標(biāo)題。

格式為：

TXT的第一行為內(nèi)容的標(biāo)題

TXT的第二行請(qǐng)保留空行（用作于區(qū)分識(shí)別作用）

TXT的第三行為內(nèi)容（內(nèi)容需要段落分明，盡量不要加載亂七八糟的符號(hào)、HTML標(biāo)簽等，少許英文也可以）

可以參考以下圖片樣例：

訓(xùn)練語(yǔ)料排版需要段落分明，這樣最終學(xué)習(xí)的模型也會(huì)參照語(yǔ)料排版進(jìn)行學(xué)習(xí)。

任何模型都很依賴于原始語(yǔ)料，如果您的數(shù)據(jù)有AI生成數(shù)據(jù)，那么可能最終的模型也會(huì)被檢測(cè)AI內(nèi)容，如果對(duì)內(nèi)容檢測(cè)有要求，請(qǐng)盡量使用22年以前的數(shù)據(jù)，避免GPT生成的數(shù)據(jù)進(jìn)行訓(xùn)練。

訓(xùn)練數(shù)據(jù)需要5萬(wàn)篇以上，太少的話，模型能力會(huì)很弱。

關(guān)于語(yǔ)料數(shù)量的解釋：

1、數(shù)據(jù)越多，你的模型能力就越強(qiáng)，并不是數(shù)據(jù)越多，你的模型生成的內(nèi)容就越多。模型生成的數(shù)量是無(wú)限的，不管多少數(shù)據(jù)量訓(xùn)練的模型，同標(biāo)題生成不同數(shù)量的文章內(nèi)容，都不會(huì)重復(fù)，僅可能出現(xiàn)少數(shù)句子，段落重復(fù)。

2、訓(xùn)練語(yǔ)料的多少，決定模型的知識(shí)含量而已，增加它的詞匯量以及句子理解能力。比如：10萬(wàn)的訓(xùn)練數(shù)據(jù)，都是小學(xué)生學(xué)習(xí)的詞語(yǔ)和句子等內(nèi)容；20萬(wàn)的語(yǔ)料數(shù)據(jù)里，就有初中生的學(xué)習(xí)的內(nèi)容。不可能模型學(xué)習(xí)了10萬(wàn)的數(shù)據(jù)，你讓他生成初中的內(nèi)容，模型是無(wú)法生成出來(lái)的。因?yàn)樗紱]學(xué)習(xí)到知識(shí)，肯定是不無(wú)法生成您所需要的內(nèi)容。

簡(jiǎn)單點(diǎn)講：數(shù)據(jù)量越多，模型對(duì)內(nèi)容的詞匯和知識(shí)就掌握的越多。

但推薦模型訓(xùn)練數(shù)據(jù)在5~50萬(wàn)就可以，不必要上百萬(wàn)。數(shù)據(jù)量太大，訓(xùn)練時(shí)間太長(zhǎng)，成本太大，不建議這么操作。

2、工具的使用

訓(xùn)練語(yǔ)料準(zhǔn)備好了后，推薦以下工具進(jìn)行清洗處理：

免費(fèi)工具：

閃豚速寫訓(xùn)練數(shù)據(jù)二次篩選強(qiáng)制清洗工具

閃豚AI

23年6月21日
喜歡：2
瀏覽：137

收費(fèi)工具：（根據(jù)個(gè)人需求選擇使用）

語(yǔ)料格式、內(nèi)容、編碼清洗小工具[出售]

￥98

￥198

庫(kù)存：9.9k
已售：37
人氣：590

閃豚AI語(yǔ)料內(nèi)容重復(fù)檢索工具[出售]

￥198

￥298

庫(kù)存：9.9k
已售：32
人氣：447

3、訓(xùn)練數(shù)據(jù)的處理

請(qǐng)參照下圖解釋說明，填寫好對(duì)應(yīng)的路徑，點(diǎn)擊開始處理即可。

四、模型訓(xùn)練

1、參數(shù)說明

顯卡設(shè)備序號(hào)：默認(rèn)為0，指的是您顯卡在您電腦中的設(shè)備序號(hào)，基本都是0，無(wú)需更改。您可以打開您的電腦任務(wù)管理器，在性能里面，有個(gè)GPU，GPU后面會(huì)有個(gè)序號(hào)：

訓(xùn)練數(shù)據(jù)路徑：選擇您上一步處理的學(xué)習(xí)語(yǔ)料的文件，也就是JSON文件。

訓(xùn)練次數(shù)：對(duì)你的數(shù)據(jù)訓(xùn)練多少次，訓(xùn)練步數(shù)=你的數(shù)據(jù)量。

訓(xùn)練總數(shù)=你的語(yǔ)料數(shù)據(jù)x訓(xùn)練次數(shù)。

例如：您的語(yǔ)料數(shù)據(jù)為10萬(wàn)，那么你的訓(xùn)練步數(shù)就是10萬(wàn)步。您設(shè)置訓(xùn)練5次，那就是100000x5=50萬(wàn)步。

Batch_size：顯卡的批處理，24Gb顯存顯卡，如果使用標(biāo)準(zhǔn)模型，請(qǐng)保持參數(shù)為“1”，如果使用small模型，該參數(shù)可以調(diào)大，每增加1，占用顯存會(huì)大一倍。調(diào)整此處可以增加模型訓(xùn)練學(xué)習(xí)效率。

比如：您顯存為24Gb，如果使用標(biāo)準(zhǔn)模型，那么僅能設(shè)置“1”，如果您使用small模型，該參數(shù)可以設(shè)置“4”，因?yàn)閟mall模型訓(xùn)練占用顯存為：“6Gb”左右。

save_steps：該參數(shù)為模型保存步數(shù)，也就是您訓(xùn)練多少步后保存一個(gè)模型，防止模型出錯(cuò)。建議使用默認(rèn)每一萬(wàn)步就保存一個(gè)模型。如果覺得保存太多，占用太多的硬盤空間，那么可以調(diào)整該參數(shù)，可以設(shè)置每5萬(wàn)或者10萬(wàn)或者更多保存一個(gè)模型。

學(xué)習(xí)效率：該參數(shù)請(qǐng)保持默認(rèn)

epsilon：該參數(shù)請(qǐng)保持默認(rèn)

logging_steps：該參數(shù)為訓(xùn)練日志的保存，訓(xùn)練日志能直觀的看到每條訓(xùn)練數(shù)據(jù)的學(xué)習(xí)成果，也就是loss值，一個(gè)模型loss值推薦在2以下，就可以很好使用。該參數(shù)建議請(qǐng)保持跟save_steps參數(shù)保持一致。

max_len：Token詞匯量的輸入，推薦使用900，參數(shù)設(shè)置900能更穩(wěn)定的訓(xùn)練標(biāo)準(zhǔn)模型。如果您使用的是Small小模型，可以使用1024參數(shù)。

sed：該參數(shù)請(qǐng)保持默認(rèn)

模型保存路徑：該參數(shù)請(qǐng)選擇訓(xùn)練好的模型保存位置，路徑也需要使用英文或者拼音，請(qǐng)避免使用中文路徑。

定制化模型：該參數(shù)請(qǐng)不要填寫，該參數(shù)為企業(yè)用戶私有化定制訓(xùn)練模型的路徑。

2、使用流程

根據(jù)要求，填寫好對(duì)應(yīng)的參數(shù)后，請(qǐng)點(diǎn)擊預(yù)載模型：

點(diǎn)擊后，則會(huì)從中央驗(yàn)證服務(wù)器中下載加載模型權(quán)重：

完成后會(huì)有以上提醒，模型預(yù)載完成后，就可以點(diǎn)擊開始訓(xùn)練按鈕進(jìn)行模型訓(xùn)練。

請(qǐng)注意：每次關(guān)閉軟件后，需要使用模型訓(xùn)練功能，都需要重新點(diǎn)擊預(yù)載模型。

3、中斷訓(xùn)練說明

如果模型訓(xùn)練過程中出現(xiàn)意外導(dǎo)致訓(xùn)練中斷，需要接著訓(xùn)練的時(shí)候，要確保模型保存路徑下至少已保存2份步伐模型；

也就是以上圖片中的文件夾，請(qǐng)至少確保有2個(gè)文件夾以上，才能接著訓(xùn)練。

中斷訓(xùn)練會(huì)加載倒數(shù)第二個(gè)文件夾中的模型權(quán)重進(jìn)行訓(xùn)練。

例如：您的總訓(xùn)練步伐是100萬(wàn)，在您訓(xùn)練26萬(wàn)步的時(shí)候，訓(xùn)練中斷了，您設(shè)置的參數(shù)是，每1萬(wàn)步保存一個(gè)模型。那么您的路徑下應(yīng)該有：

checkpoint-260000

checkpoint-250000

checkpoint-240000

......

等等模型文件夾。需要繼續(xù)訓(xùn)練的時(shí)候，請(qǐng)保持您上一次的模型訓(xùn)練參數(shù)，然后點(diǎn)擊預(yù)載模型，模型預(yù)載完成后，點(diǎn)擊開始訓(xùn)練即可。

軟件算法會(huì)加載您路徑下所有的已存儲(chǔ)的模型文件夾，自動(dòng)檢索模型權(quán)重，最終會(huì)從checkpoint-250000開始往后訓(xùn)練。

4、訓(xùn)練其他說明

1、訓(xùn)練完成后，不支持增量訓(xùn)練，僅支持增加訓(xùn)練次數(shù)，加深訓(xùn)練。（增量訓(xùn)練是指，您首次訓(xùn)練模型使用的是10萬(wàn)語(yǔ)料，然后第二次訓(xùn)練，重新預(yù)處理了20萬(wàn)語(yǔ)料，再訓(xùn)練。這樣的話就需要新訓(xùn)練，而不能繼續(xù)訓(xùn)練，否則導(dǎo)致模型損壞。）

2、訓(xùn)練開始前，可以打開軟件的根目錄，找到y(tǒng)ingpan.ini

打開它。您會(huì)看到如下：

該配置文件主要是給模型訓(xùn)練提供足夠的存儲(chǔ)空間保障。當(dāng)您的硬盤空間不足時(shí)，達(dá)到了軟件設(shè)置的磁盤空間閾值，軟件每次新保存訓(xùn)練模型，則自動(dòng)刪除最老的模型文件，這樣循環(huán)下去，始終會(huì)為您的硬盤保留指定值的空間進(jìn)行存儲(chǔ)新的模型。

如果覺得你硬盤中保存過多的步伐模型保存文件，影響硬盤空間，可以手動(dòng)刪除一些，或者調(diào)大保存步伐。手動(dòng)刪除的話，要確保至少預(yù)留五個(gè)步伐模型，以防止意外。

3、訓(xùn)練過程中，您會(huì)看到界面中輸出如下值：

5、模型訓(xùn)練日志

1、首先界面中的：Iter（loss=x.xxx），這個(gè)數(shù)值僅代表該條訓(xùn)練數(shù)據(jù)對(duì)我們預(yù)訓(xùn)練模型的詞典進(jìn)行匹配學(xué)習(xí)的loss值。僅僅是該條數(shù)據(jù)的學(xué)習(xí)值。正確的每批次訓(xùn)練的loss值，在軟件的根目錄下，logs文件夾內(nèi)，train-2023-xx-xx-xx-xx.log，該文件內(nèi)進(jìn)行查看。該文件名為：train-年-月-日-時(shí)-分.log，也就是你開始訓(xùn)練的時(shí)間，每次訓(xùn)練，都會(huì)有一個(gè)開始訓(xùn)練的時(shí)間為命名的訓(xùn)練日志。在該日志內(nèi)查看訓(xùn)練的loss值。

打開日志文件后，日志的記錄內(nèi)容是上圖顯示；

Epoch代表的是第幾輪的訓(xùn)練，從0開始。

global_step：代表的是訓(xùn)練的步數(shù)，也就是界面中設(shè)置的。

最后看，train_loss值，loss值在2左右，就說明模型基本上學(xué)習(xí)到了你的數(shù)據(jù)內(nèi)容。Loss值越低，模型越好。

五、訓(xùn)練功能其他說明

待補(bǔ)充

六、生成教學(xué)

重要說明：載入模型路徑，模型文件存儲(chǔ)的路徑不要有中文！目錄路徑一定要英文或者拼音！

選擇模型路徑，是選擇你訓(xùn)練好的模型存放的路徑，默認(rèn)模型文件夾名稱是：checkpoint-XXXXX（XX代表數(shù)字），如：D:/STUNAI/checkpoint-100000

1、批量生成數(shù)據(jù)表格式要求：

自行創(chuàng)建生成數(shù)據(jù)，要求格式如上圖，新建一份TXT文檔，里面生成數(shù)據(jù)每行一條。

推薦使用官方語(yǔ)料生成數(shù)據(jù)表提取工具，生成效果會(huì)更好。

點(diǎn)擊下方卡片推薦內(nèi)容跳轉(zhuǎn)下載。

閃豚AI生成語(yǔ)料數(shù)據(jù)表提取工具

閃豚AI

23年7月12日
喜歡：9
瀏覽：254

如果提取語(yǔ)料的數(shù)量比較大，導(dǎo)致數(shù)據(jù)表很大，建議使用數(shù)據(jù)表分割工具，進(jìn)行分割使用。

點(diǎn)擊下方卡片推薦，進(jìn)行跳轉(zhuǎn)下載。

閃豚AI生成數(shù)據(jù)分割小工具

閃豚AI

23年7月30日
喜歡：0
瀏覽：50

提取完成后的數(shù)據(jù)表標(biāo)準(zhǔn)如下圖展示：

可以看到，標(biāo)準(zhǔn)數(shù)據(jù)表里面，前面是該條生成任務(wù)的標(biāo)題，###三個(gè)井號(hào)后面，就是起始句，也就是文章的第一句話。

2、為什么要標(biāo)題和起始句，直接使用關(guān)鍵詞載入生成不行？

對(duì)于這個(gè)問題，AI模型需要更好的提示，才能推理生成更準(zhǔn)確更符合要求的內(nèi)容。一個(gè)關(guān)鍵詞僅幾個(gè)中文字，模型是無(wú)法判斷你這個(gè)任務(wù)的最終需求，比如讓你自己寫一份材料，只有一個(gè)關(guān)鍵詞，相信你也無(wú)法下手寫作。AI模型也是一樣的道理，需要給它更多的提示和任務(wù)指令，它才能更好的輸出符合你要求的內(nèi)容。

AI訓(xùn)練的時(shí)候，語(yǔ)料也是有標(biāo)題和內(nèi)容的，AI模型學(xué)習(xí)訓(xùn)練，它需要先學(xué)習(xí)每篇文章的標(biāo)題，再學(xué)習(xí)內(nèi)容，也就能明白這個(gè)標(biāo)題的作用，所以推理生成的時(shí)候，也是一樣，需要給它標(biāo)題和第一句話，引導(dǎo)AI推理更準(zhǔn)確的內(nèi)容。

如果只有關(guān)鍵詞，沒有標(biāo)題和起始句怎么辦？可以購(gòu)買根據(jù)關(guān)鍵詞抓取相關(guān)標(biāo)題和起始句的收費(fèi)插件。

上面推薦的卡片鏈接，插件就能實(shí)現(xiàn)根據(jù)關(guān)鍵詞，去爬取相關(guān)的標(biāo)題和起始句。然后會(huì)生成標(biāo)準(zhǔn)的生成數(shù)據(jù)表。

還是更加推薦直接提取語(yǔ)料的標(biāo)題和起始句，用作生成任務(wù)。不用擔(dān)心，即使同一標(biāo)題和起始句，最終生成的數(shù)據(jù)內(nèi)容，也不會(huì)重復(fù)一致。

3、提取完數(shù)據(jù)表后，就可以使用各種批量生成功能

開始生成的時(shí)候，建議使用單篇生成，進(jìn)行模型生成參數(shù)調(diào)整修改，根據(jù)你的模型任務(wù)，找到一個(gè)最適合的參數(shù)，因?yàn)檐浖詭У膮?shù)，屬于通用參數(shù)，中規(guī)中矩，用戶仔細(xì)訓(xùn)練的不同任務(wù)的行業(yè)模型，都需要調(diào)整生成參數(shù)，這樣才能達(dá)到生成效果更好的狀態(tài)，參數(shù)調(diào)整教程請(qǐng)點(diǎn)擊下方卡片推薦：

閃豚速寫軟件推理生成功能中的參數(shù)調(diào)整說明教程

閃豚AI

23年8月30日
喜歡：10
瀏覽：602

調(diào)整到了適合的參數(shù)后，就去批量生成或者雙標(biāo)題、圖文生成中修改你調(diào)整的參數(shù)，最后就可以進(jìn)行內(nèi)容的生產(chǎn)。

4、使用雙標(biāo)題為什么推理會(huì)很慢？

因?yàn)殡p標(biāo)題功能，我們采用的策略是去獲取百度下拉結(jié)果，需要與百度進(jìn)行通信，所以就會(huì)導(dǎo)致有個(gè)時(shí)間損耗，會(huì)比普通生成慢。如果自己有雙標(biāo)題工具，完全可以使用自己的工具，把數(shù)據(jù)表的標(biāo)題，先單獨(dú)弄成雙標(biāo)題，然后再開啟普通的批量生成就行。生成的內(nèi)容也是聚合生成。

5、圖文功能是怎么樣的？

軟件中，圖文生成功能，并不是根據(jù)生成內(nèi)容，生成出圖片，而是生成內(nèi)容的同時(shí)，軟件算法會(huì)根據(jù)你需要給內(nèi)容加入多少?gòu)埮鋱D，會(huì)對(duì)內(nèi)容進(jìn)行分析，再根據(jù)標(biāo)題，段落內(nèi)容，去百度圖庫(kù)調(diào)取相關(guān)圖片的URL，最終保存為TXT。（請(qǐng)注意，調(diào)用百度圖片會(huì)有侵權(quán)風(fēng)險(xiǎn)，請(qǐng)自行甄別使用）

圖文生成功能如上圖展示，TXT的內(nèi)容里，穿插URL的標(biāo)簽

6、軟件支持標(biāo)題聚合生成

什么是聚合生成？

當(dāng)你的標(biāo)題格式如下：

斑鳩吃什么（斑鳩飼養(yǎng)）###斑鳩吃什么？野外生活的斑鳩一般都是在地面找食,

標(biāo)題中，斑鳩吃什么（斑鳩飼養(yǎng)）這樣的，軟件算法則會(huì)生成兩篇內(nèi)容，聚合成一篇內(nèi)容：

聚合生成支持多種標(biāo)題格式，如：

標(biāo)題A（標(biāo)題B）###起始句

標(biāo)題A(標(biāo)題B)###起始句

標(biāo)題A！標(biāo)題B###起始句

標(biāo)題A？標(biāo)題B###起始句

以上的標(biāo)題格式，都會(huì)進(jìn)行聚合生成。優(yōu)先級(jí)如下：

（）＞()＞?。?？

中文括號(hào)（全角括號(hào)）＞英文括號(hào)(半角括號(hào))＞感嘆號(hào)＞問號(hào)

請(qǐng)注意：如果在括號(hào)內(nèi)的副標(biāo)題，小于三個(gè)中文漢字時(shí)候，是不生效的，副標(biāo)題需要大于三個(gè)中文漢字。

所以，在生成數(shù)據(jù)表中，如果標(biāo)題含有以上數(shù)據(jù)格式，都會(huì)進(jìn)行聚合生成，這樣就極大避免文章有多標(biāo)題，但是沒有副標(biāo)題的內(nèi)容，導(dǎo)致內(nèi)容關(guān)聯(lián)性不強(qiáng)的問題。

七、其他教學(xué)

使用過程中遇到其他問題，先進(jìn)入教程專區(qū)看有沒有教程解決，無(wú)教程再聯(lián)系技術(shù)售后。

教程專區(qū)：http://yunzou.com.cn/aidownload/aixuexi

點(diǎn)我訪問教程專區(qū)

其他問題待補(bǔ)充

閃豚速寫Pro-1.9.1更新說明

閃豚AI — Tue, 29 Aug 2023 14:34:40 +0000

一、參數(shù)的優(yōu)化調(diào)整

關(guān)于本次更新Pro1.9.1，優(yōu)化調(diào)整了Max len參數(shù)說明。請(qǐng)使用者按以下解釋指導(dǎo)進(jìn)行訓(xùn)練操作。

本次調(diào)整Max len參數(shù)，在安裝包1.9.1會(huì)自動(dòng)調(diào)整900。（原參數(shù)為1024）

如已安裝其他版本的包，本次使用在線更新，該參數(shù)無(wú)法覆蓋，需手動(dòng)修改為“900”參數(shù)值，如下圖展示：

原因如下：

原本參數(shù)為1024，指的是1024的Token詞匯長(zhǎng)度進(jìn)行輸入。在某些情況下，當(dāng)顯存為24Gb時(shí)（24576MiB），正常訓(xùn)練使用，會(huì)占用到“24000MiB”的顯存，可能僅剩下：“576MiB”，也就是剩下很少很少，只要有其他應(yīng)用占用一下GPU的顯存，可能就導(dǎo)致訓(xùn)練過程中出現(xiàn)“OMM”情況，也就是：“顯存爆了，顯存不夠用”，就導(dǎo)致訓(xùn)練出錯(cuò)。

關(guān)于Token的詞匯，您可以簡(jiǎn)單理解為中文長(zhǎng)度就行。因?yàn)橛?xùn)練模型，在我們中央驗(yàn)證中心服務(wù)器中，存儲(chǔ)了預(yù)訓(xùn)練模型的詞匯表，也就是您訓(xùn)練的時(shí)候，對(duì)數(shù)據(jù)預(yù)處理后，可訓(xùn)練文件Json中的所有文字，在訓(xùn)練開始時(shí)，會(huì)對(duì)模型詞匯表進(jìn)行匹配，如正確匹配則進(jìn)行分詞訓(xùn)練，這個(gè)步驟是個(gè)復(fù)雜的NLP知識(shí)理論，您不需要了解很深，如對(duì)此感興趣，可自行查閱通用模型訓(xùn)練相關(guān)的學(xué)習(xí)資料。

本次優(yōu)化了訓(xùn)練架構(gòu)，推薦所有用戶，將該參數(shù)調(diào)整為：900，進(jìn)行訓(xùn)練，這樣能更大的留存1~2Gb的顯存進(jìn)行緩沖。

請(qǐng)注意：原參數(shù)為1024，現(xiàn)調(diào)整900，對(duì)模型的影響很小很小。不比太過于擔(dān)心模型的質(zhì)量會(huì)受到影響。反而調(diào)整了該參數(shù)，能更穩(wěn)定的提升模型訓(xùn)練過程。此步驟是極其值得推薦操作的。

二、模型的選擇使用

推薦24Gb顯卡的用戶們，也可以嘗試使用Small模型，Small模型并不比標(biāo)準(zhǔn)模型差很多。使用Small模型，訓(xùn)練會(huì)更快。

Small模型與標(biāo)準(zhǔn)模型的能力差距如下：

標(biāo)準(zhǔn)模型：訓(xùn)練次數(shù)少，能達(dá)到不錯(cuò)的效果

	標(biāo)準(zhǔn)模型	Small模型
訓(xùn)練時(shí)長(zhǎng)	推薦訓(xùn)練5輪左右就可用	推薦訓(xùn)練30~50輪左右
訓(xùn)練速度	3090每秒2~4條數(shù)據(jù)訓(xùn)練 4090每秒5~8條數(shù)據(jù)訓(xùn)練	3090每秒10~15條數(shù)據(jù)訓(xùn)練 4090每秒20~25條數(shù)據(jù)訓(xùn)練
模型能力	支持語(yǔ)料長(zhǎng)度3倍生成輸出	對(duì)超越語(yǔ)料原始字?jǐn)?shù)生成輸出不太好
模型大小	成品模型大約在6Gb左右	成品模型大約在2Gb左右
知識(shí)能力	能承載百萬(wàn)級(jí)以上語(yǔ)料訓(xùn)練	僅承載50萬(wàn)級(jí)語(yǔ)料以下訓(xùn)練

推薦用戶們可以嘗試使用Small模型進(jìn)行體驗(yàn)使用。

閃豚AI生成數(shù)據(jù)篩查工具

閃豚AI — Wed, 23 Aug 2023 13:37:43 +0000

工具介紹：

本工具主要為檢查生成數(shù)據(jù)表中是否含有重復(fù)標(biāo)題數(shù)據(jù)以及檢查已生成內(nèi)容異常缺少問題。

比如：數(shù)據(jù)表中有很多重復(fù)的數(shù)據(jù)，就會(huì)被檢測(cè)出來(lái)告知有哪些標(biāo)題是重復(fù)的。

比如：生成數(shù)據(jù)表中數(shù)據(jù)有1萬(wàn)條，但是實(shí)際生成出的內(nèi)容只有5000個(gè)內(nèi)容，通過該工具檢測(cè)，就知道數(shù)據(jù)表中有哪些數(shù)據(jù)沒有進(jìn)行生成/遺漏。

使用說明：

如果僅需要篩查數(shù)據(jù)表，填寫或選擇好數(shù)據(jù)表的文件路徑，點(diǎn)擊“僅篩查生成數(shù)據(jù)表內(nèi)重復(fù)數(shù)據(jù)”按鈕即可。

如果需要篩查已生成的數(shù)據(jù)是否缺漏，選擇好你的數(shù)據(jù)表，再選擇該數(shù)據(jù)表的內(nèi)容保存路徑，點(diǎn)擊篩查即可。

最終的分析文件，會(huì)存放到軟件的根目錄下。

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚AI生成數(shù)據(jù)分割小工具

閃豚AI — Sun, 30 Jul 2023 05:38:55 +0000

本工具主要作用：

當(dāng)提取了生成數(shù)據(jù)表，一份數(shù)據(jù)表里面有數(shù)十萬(wàn)內(nèi)容需要生成，閃豚速寫支持多開和多窗口進(jìn)行生成，就需要不同的數(shù)據(jù)表，該工具就可以快速把數(shù)據(jù)表自動(dòng)分割需要的份數(shù)，方便進(jìn)行內(nèi)容生成操作。

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚AI生成語(yǔ)料數(shù)據(jù)表提取工具

閃豚AI — Wed, 12 Jul 2023 13:29:52 +0000

作用：

用于閃豚AI系統(tǒng)的批量生成數(shù)據(jù)表提取。主要從自己訓(xùn)練語(yǔ)料提取標(biāo)題和起始句作用。

提取完保存TXT文本格式的數(shù)據(jù)表文件。

也可以自己手動(dòng)制作批量生成數(shù)據(jù)表，格式如下：

標(biāo)題###起始句

請(qǐng)注意：數(shù)據(jù)表需要一行一條數(shù)據(jù)，前面是標(biāo)題，后面是起始句。

本次發(fā)布該小工具是已剝離原系統(tǒng)自帶該小功能，以獨(dú)立小工具方式為閃豚用戶提供服務(wù)。

優(yōu)化提取策略

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

關(guān)于模型中斷后繼續(xù)訓(xùn)練說明

閃豚AI — Mon, 10 Jul 2023 10:17:32 +0000

我們優(yōu)化改進(jìn)了這個(gè)功能的算法，現(xiàn)在能更好的識(shí)別中斷模型的參數(shù)。

當(dāng)模型訓(xùn)練過程中，遇到意外中斷或者主動(dòng)中斷訓(xùn)練，當(dāng)不改變訓(xùn)練參數(shù)（epoch參數(shù)值除外），需要加載上一次中斷前保存的完整的模型，就可以繼續(xù)接著該模型再次訓(xùn)練。

例如1：

當(dāng)我模型設(shè)置Epoch值為10輪，我訓(xùn)練到5輪的時(shí)候，checkpoint-500000，這里中斷了，測(cè)試checkpoint-500000該模型能力，發(fā)現(xiàn)并未達(dá)到訓(xùn)練需求，還想接著訓(xùn)練，那么就要確保checkpoint-500000模型完整。直接開啟新的訓(xùn)練即可，此時(shí)，epoch能增大而不能減少。意思就是：原始設(shè)置的Epoch為10，想加深訓(xùn)練，可以設(shè)置為20，而不能減少為9。

例如2：

當(dāng)模型設(shè)置Epoch為10輪，10輪訓(xùn)練結(jié)束，最后的模型為：checkpoint-1000000，測(cè)試該模型并未達(dá)到理想效果，還想接著訓(xùn)練，那么，就需要把epoch設(shè)置為20或者更多（這個(gè)數(shù)值自定義），設(shè)置好了后，就可以繼續(xù)讀取checkpoint-1000000模型參數(shù)繼續(xù)訓(xùn)練，那么下一輪就會(huì)保存：checkpoint-1100000。

也就是說，新的模型算法，加載為最新的保存模型，而不是讀取完整三輪模型。想要接著訓(xùn)練，僅需要保存最新的模型即可，但是請(qǐng)不要更改訓(xùn)練學(xué)習(xí)率或者訓(xùn)練的JSON。JSON不能新增也不能減少。否則無(wú)法繼續(xù)訓(xùn)練。

值得注意的是：1.8.3版本之前的模型，如果接著訓(xùn)練，loss值會(huì)重新計(jì)算更迭，但是訓(xùn)練的學(xué)習(xí)內(nèi)容，模型都是完整接上，不必?fù)?dān)心模型沒有接上訓(xùn)練。

1.8.3版本之后，如果模型中斷，繼續(xù)訓(xùn)練，loss值會(huì)接上（該算法為測(cè)試版，可能會(huì)對(duì)loss值有遺漏）

閃豚AI刪除TXT指定行數(shù)工具

閃豚AI — Fri, 30 Jun 2023 03:59:48 +0000

本功能工具可以處理刪除路徑下所有TXT文檔的指定行數(shù)。

比如你需要?jiǎng)h除TXT文檔中的第一行和第二行。則在開始刪除和結(jié)束刪除參數(shù)輸入1,2即可。

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚AI-V3-221209 - 福利贈(zèng)送（1.99元可享下載體驗(yàn)）

閃豚AI — Wed, 28 Jun 2023 08:24:12 +0000

本程序項(xiàng)目以學(xué)習(xí)研究目的放出讓廣大用戶體驗(yàn)學(xué)習(xí)。

閃豚官方承諾：項(xiàng)目源碼等功能確保完整可用，但需要有Python基礎(chǔ)配置基礎(chǔ)環(huán)境，環(huán)境配置完成后，閃豚官方承諾該項(xiàng)目一定完整可用。

閃豚AI-V3-221209官方發(fā)售價(jià)格：5200元！

官方發(fā)布，不用擔(dān)心不可用，有后門，有病毒，代碼開源，僅核心算法加密！

本次作為福利贈(zèng)送產(chǎn)品，不提供任何技術(shù)咨詢和技術(shù)服務(wù)，需要自行解決技術(shù)問題。

如需技術(shù)服務(wù)或技術(shù)咨詢，需另支付技術(shù)服務(wù)費(fèi)。

系統(tǒng)部署：500元/次

技術(shù)咨詢：300元/小時(shí)

技術(shù)服務(wù)：1800元/月（含一次系統(tǒng)部署、技術(shù)咨詢服務(wù)）

本福利產(chǎn)品確保該完整可用，包含單篇生成功能、批量生成功能、批量雙標(biāo)題生成功能。該基礎(chǔ)功能確保無(wú)任何使用問題。

AI系統(tǒng)部署要求環(huán)境依賴包：

依賴包名稱	版本	備注
python	3.6.3
CUDA+CUDNN	11
transformers	4.6.0
sentencepiece	0.1.94
Flask	1.1.2
jieba	/
pandas	/
sklearn	/
zhconv	/
tensorboardX	/
func_timeout	/
torch+torchvision	torch-1.7.0 torchvision-0.8.0
numpy	/

需要安裝以上依賴，才可以跑通AI程序

參照上方環(huán)境需求，安裝完成后，均可實(shí)現(xiàn)跑通程序。

請(qǐng)注意，一定需要安裝以上依賴，才可以跑通AI程序。

如新手不會(huì)，可以先去B站學(xué)習(xí)：Python環(huán)境的搭建或者使用Anaconda配置Python虛擬環(huán)境，python項(xiàng)目如何跑通，需要先學(xué)習(xí)python基礎(chǔ)，Bilibili上很多基礎(chǔ)教程。

歡迎加入我們交流群，后續(xù)不斷贈(zèng)送AI相關(guān)軟件免費(fèi)體驗(yàn)：

歡迎關(guān)注我們公眾號(hào)，有更多福利消息和閃豚消息，均在公眾號(hào)上推送！

閃豚速寫已發(fā)布新品，可以點(diǎn)擊查看更多！

閃豚速寫Pro[出售]

￥7800

庫(kù)存：116
人氣：6.3k

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚速寫訓(xùn)練數(shù)據(jù)二次篩選強(qiáng)制清洗工具

閃豚AI — Wed, 21 Jun 2023 13:36:34 +0000

該工具主要作用，二次清理篩選訓(xùn)練數(shù)據(jù)JSON文件。

很多用戶自行采集的語(yǔ)料很亂，導(dǎo)致程序處理出來(lái)的，有問題，最終就導(dǎo)致訓(xùn)練出問題。

再次強(qiáng)調(diào)，訓(xùn)練出問題，100%是數(shù)據(jù)文件的問題，語(yǔ)料數(shù)據(jù)的問題！

自行采集整理語(yǔ)料，一定要按照要求整理！

第一行為標(biāo)題

第二行留空

第三行為內(nèi)容

不是這種標(biāo)準(zhǔn)語(yǔ)料的，都是有問題的。就不要再說，訓(xùn)練怎么又閃退！

建議當(dāng)你不確定你語(yǔ)料有沒有問題，你就二次用這個(gè)清洗一下你的JSON文件。

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

關(guān)于生成多線程使用教程

閃豚AI — Wed, 21 Jun 2023 08:08:03 +0000

首先打開我們的生成窗口。

可以看到上方有窗口一到窗口五。

使用方法：

當(dāng)你窗口一填寫好生成參數(shù)后，需要點(diǎn)擊保存設(shè)置，然后開啟推理。

（當(dāng)開始生成了，再點(diǎn)擊窗口二，填寫好參數(shù)，再點(diǎn)擊保存設(shè)置，這樣才是運(yùn)行多線程。）

請(qǐng)注意：開啟多線程生成。需要關(guān)注你的GPU占用性能，GPU顯存占用隨著你生成字?jǐn)?shù)長(zhǎng)度而增長(zhǎng)改變。

【更新軟件版】【收費(fèi)工具】語(yǔ)料內(nèi)容清洗小工具

閃豚AI — Thu, 15 Jun 2023 03:48:26 +0000

2023-6-15更新，已打包成可執(zhí)行EXE文件。不需要單獨(dú)安裝環(huán)境。

語(yǔ)料內(nèi)容清洗小工具功能介紹

1.批量解決訓(xùn)練語(yǔ)料編碼非UTF-8（自動(dòng)把編碼統(tǒng)一轉(zhuǎn)為UTF-8）

2.批量解決訓(xùn)練語(yǔ)料內(nèi)容有各種html標(biāo)簽（自動(dòng)過濾各種標(biāo)簽）

3.批量解決訓(xùn)練語(yǔ)料多余空格自動(dòng)過濾。

4.批量解決統(tǒng)一規(guī)范訓(xùn)練語(yǔ)料格式要求。（整理除第一行標(biāo)題外，第二行程序會(huì)處理成自動(dòng)空行，第三行就是語(yǔ)料內(nèi)容了）

5.批量處理語(yǔ)料的簡(jiǎn)易排版，實(shí)現(xiàn)每段前面都加兩個(gè)空格。

6.增加了檢測(cè)內(nèi)容不符條件，當(dāng)TXT內(nèi)容少于100字中文時(shí)，直接過濾。（這種措施是防止有些位置的亂碼，符號(hào)等無(wú)法過濾，導(dǎo)致TXT文本中沒中文，就統(tǒng)一過濾掉）

6.更新加入報(bào)錯(cuò)處理，非常規(guī)問題異常報(bào)錯(cuò)文件單獨(dú)保存到一份新的文件夾內(nèi)，不進(jìn)行處理。

7.更新優(yōu)化處理邏輯。

聲明：由于此工具并非AI項(xiàng)目配套必須品（人工完全自己也可以把控采集時(shí)把訓(xùn)練語(yǔ)料處理干凈標(biāo)準(zhǔn)），此工具只為協(xié)助解決處理你的語(yǔ)料數(shù)據(jù)，提升使用者的方便，所以本工具需另收費(fèi)。本工具僅限用于我們閃豚AI的訓(xùn)練語(yǔ)料批量處理。

優(yōu)勢(shì)介紹

使用本工具后，能全自動(dòng)化高速處理訓(xùn)練語(yǔ)料，也就是說，你采集的語(yǔ)料只需采集的時(shí)候要把換行弄好，排版弄好就行。剩下的如果有多的各種html標(biāo)簽等，或者多的空格和換行。該工具都可以給你完美解決好。

暫定價(jià)格：98元（買斷制）

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚速寫AI模型發(fā)布交易時(shí)必備語(yǔ)料樣本抽取工具

閃豚AI — Mon, 12 Jun 2023 03:10:06 +0000

請(qǐng)所有發(fā)布模型交易的用戶，發(fā)布模型交易內(nèi)容，需要使用該工具進(jìn)行語(yǔ)料樣本抽樣，本工具會(huì)抽樣你訓(xùn)練的模型語(yǔ)料隨機(jī)3%的數(shù)據(jù)進(jìn)行壓縮打包。

發(fā)布交易的時(shí)候，需要將語(yǔ)料樣本壓縮包，也上傳到網(wǎng)盤去，做個(gè)分享鏈接，以便購(gòu)買用戶進(jìn)行模型數(shù)據(jù)核驗(yàn)。

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

【推薦】一招教你如何計(jì)算閃豚速寫模型訓(xùn)練成本！

閃豚AI — Sun, 11 Jun 2023 12:51:18 +0000

2023年9月26日，新增模型成本計(jì)算器工具，本文底部有下載鏈接。

模型訓(xùn)練成本計(jì)算其實(shí)并不難，我們閃豚速寫訓(xùn)練的時(shí)候，現(xiàn)在能直接計(jì)算大概一輪訓(xùn)練時(shí)長(zhǎng)，僅需要計(jì)算，設(shè)備損耗，電費(fèi)，數(shù)據(jù)費(fèi)用就能得到一個(gè)模型的成本了。

下面教大家如何去計(jì)算成本：

模型成本公式：
顯卡發(fā)行價(jià)格 x 0.0005x訓(xùn)練時(shí)長(zhǎng)

語(yǔ)料費(fèi)用：
范圍語(yǔ)料：每篇0.02元x20%
半精語(yǔ)料：每篇0.04元x20%
全精語(yǔ)料：每篇0.1元x20%

（這里的20%指的是你語(yǔ)料的成本，因?yàn)閿?shù)據(jù)是最貴的。）

加上電腦其他硬件損耗
加上電費(fèi)

公式：顯卡損耗+語(yǔ)料數(shù)據(jù)+其他硬件損耗+模型訓(xùn)練電費(fèi)=成本費(fèi)用

就是最終的模型成本費(fèi)用。

所以建議大家如果訓(xùn)練的模型需要上傳交易，可以參考以上成本計(jì)算，其次，語(yǔ)料數(shù)據(jù)單獨(dú)交易，也可以參考以上語(yǔ)料單篇價(jià)格。

可以下載使用最新發(fā)布的模型訓(xùn)練成本計(jì)算器

http://yunzou.com.cn/app/70445.html

閃豚速寫緩存清除

閃豚AI — Sat, 10 Jun 2023 06:24:55 +0000

當(dāng)有時(shí)候需要強(qiáng)行清除閃豚速寫軟件緩存時(shí)，可以使用該小工具

下載權(quán)限

查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為

登錄后免費(fèi)下載登錄

小黑屋反思中，不準(zhǔn)下載！

評(píng)論后刷新頁(yè)面下載評(píng)論

支付以后下載
請(qǐng)先登錄

您今天的下載次數(shù)（次）用完了，請(qǐng)明天再來(lái)

支付積分以后下載立即支付

支付以后下載立即支付

您當(dāng)前的用戶組不允許下載升級(jí)會(huì)員

您已獲得下載權(quán)限

您可以每天下載資源次，今日剩余次

閃豚速寫Pro私有化模型訓(xùn)練教程

閃豚AI — Fri, 09 Jun 2023 07:14:19 +0000

注意：不管是訓(xùn)練還是生成，不要把模型放到中文文件夾路徑內(nèi)，路徑需要用英文！建議不管是什么數(shù)據(jù)，路徑都選擇英文或者拼音，不要用中文！

訓(xùn)練其實(shí)跟V3一樣的。沒什么難度。

語(yǔ)料格式：

語(yǔ)料格式跟V3要求一樣：

每個(gè)語(yǔ)料一個(gè)TXT文本。

第一行為標(biāo)題

第二行留空

第三行就是正文內(nèi)容。（正文內(nèi)容需要段落分明，不要有夾雜廣告等亂七八糟的）

以下就是訓(xùn)練教程：

首先你要準(zhǔn)備好你的訓(xùn)練語(yǔ)料，數(shù)據(jù)在10萬(wàn)左右，肯定是越多越好?，F(xiàn)在5萬(wàn)的數(shù)據(jù)量也能訓(xùn)練，但是需要訓(xùn)練稍微步伐多點(diǎn)就行。

首先打開我們的閃豚速寫Pro

進(jìn)入數(shù)據(jù)處理功能

選擇好你的原始數(shù)據(jù)路徑，選擇好保存路徑，就可以點(diǎn)擊開始處理了。就會(huì)生成到你保存路徑下有個(gè)train_data.json

打開后，數(shù)據(jù)就是這樣的

處理完了，就可以進(jìn)入模型訓(xùn)練的功能了。

選擇好你的訓(xùn)練數(shù)據(jù)，就是你剛剛處理的JSON這個(gè)文件。

顯卡設(shè)備基本上都是0（基本不用更改）

訓(xùn)練次數(shù)：默認(rèn)也可以，你調(diào)多點(diǎn)也可以，當(dāng)是數(shù)據(jù)少的時(shí)候，就要調(diào)多些，什么10輪，20輪。

Batch_size：這個(gè)默認(rèn)1就行。如果你是A100啥的，你這個(gè)就調(diào)高，1=23Gb的顯存。

save_steps：這個(gè)默認(rèn)就可以，但是如果你的數(shù)據(jù)就幾萬(wàn)，你可以調(diào)小點(diǎn)，比如：1000，默認(rèn)是100000，意思就是，每訓(xùn)練10000步，就會(huì)先保存一個(gè)階段性的模型。（如果你不想每10000步就保存一個(gè)模型，怕占用硬盤空間大，那就把這個(gè)值設(shè)置大一些，步伐模型保存是根據(jù)這個(gè)值保存的，設(shè)置10萬(wàn)步，則就跑完10條訓(xùn)練數(shù)據(jù)才保存一個(gè)步伐模型）

其他的參數(shù)都默認(rèn)就可以

選擇好你的模型保存路徑就行。

定制化模型：這個(gè)基本上不用選，這個(gè)是給大客戶定制的一些私有化預(yù)訓(xùn)練模型用的。

最后，點(diǎn)擊：預(yù)載模型（加載預(yù)訓(xùn)練模型）

不預(yù)載模型的話，是訓(xùn)練不了的，開始訓(xùn)練的時(shí)候都需要根據(jù)自己的顯存預(yù)載對(duì)應(yīng)的模型（24Gb顯存就預(yù)載標(biāo)準(zhǔn)模型，低于24Gb顯存的顯卡就預(yù)載Small模型），預(yù)載模型需要從我們驗(yàn)證服務(wù)器上下載，時(shí)間需要長(zhǎng)一些，耐心等待加載完成就行。后面就預(yù)載后就很快。

預(yù)載完成后就可以點(diǎn)擊訓(xùn)練。

【新手必看教程】閃豚速寫軟件安裝教程以及CUDA和CUDNN安裝教程

閃豚AI — Thu, 08 Jun 2023 12:37:00 +0000

請(qǐng)注意：軟件安裝時(shí)，一定不要安裝默認(rèn)路徑C盤，C盤系統(tǒng)有權(quán)限問題會(huì)導(dǎo)致軟件出現(xiàn)異常！

目前不支持50系NVIDIA GPU，請(qǐng)不要采購(gòu)50系GPU來(lái)跑AI訓(xùn)練，Torch框架不兼容最新的CUDA12.8

首次安裝閃豚速寫軟件時(shí)候，需先安裝CUDA驅(qū)動(dòng)。（本文最下方有下載地址?。?/strong>

cuda_11.8

cudnn-windows-8.8.1.3

NVIDIA驅(qū)動(dòng)（顯卡驅(qū)動(dòng)）請(qǐng)使用56x.xxx系列，不要使用最新的驅(qū)動(dòng)，可能導(dǎo)致不兼容情況！

下面是安裝教程：

首先下載這兩個(gè)東西，（本文下方有下載鏈接，或自行去NVIDIA官網(wǎng)下載CUDA驅(qū)動(dòng)和CUDNN加速器）

先運(yùn)行cuda_11.8.0_522.06_windows.exe

這里可以直接默認(rèn)，點(diǎn)擊OK

它就會(huì)自動(dòng)解壓這個(gè)安裝包的東西。

全程下一步，下一步就可以。

自動(dòng)解壓后，這就是安裝界面。點(diǎn)擊同意并繼續(xù)就行。

全部下一步。

安裝好了后，首先回到桌面，右鍵點(diǎn)擊電腦屬性，

找到：高級(jí)系統(tǒng)設(shè)置

點(diǎn)擊高級(jí)，點(diǎn)擊環(huán)境變量

然后在你的系統(tǒng)變量里面，看有沒有CUDA的變量

如果有，就可以，不需要跟我一樣。你們安裝的是11_8。如果有就可以了。

然后這個(gè)解壓出來(lái)

把解壓出來(lái)的文件夾內(nèi)這里面所有的東西都復(fù)制一下。

復(fù)制到這個(gè)路徑下：

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8

覆蓋粘貼就行。這樣你的CUDNN也安裝好了。

然后就是正題了，安裝我們的閃豚軟件

先下載好我們的安裝包，雙擊運(yùn)行它就行。

可以點(diǎn)擊那個(gè)箭頭，就可以自己更換安裝目錄（一定不要安裝在默認(rèn)路徑C盤，自行更換路徑）

默認(rèn)是安裝到：C:\Program Files (x86)\ShanTunAI\

建議系統(tǒng)安裝到500G的空余硬盤上?；蛘邔ｉT拿塊硬盤留給閃豚AI軟件使用。因?yàn)樯婕澳Ｐ陀?xùn)練等，會(huì)很占用磁盤空間。

安裝前，請(qǐng)先看《軟件許可及服務(wù)協(xié)議》，如不同意，則請(qǐng)不要使用，如安裝使用，就默認(rèn)同意我們的許可和協(xié)議！

選擇好路徑后，就點(diǎn)擊一鍵安裝就可以了。

就會(huì)自動(dòng)安裝。

安裝完，就可以點(diǎn)擊開始使用了。

安裝完成，就可以打開軟件，注冊(cè)軟件賬戶和激活，官網(wǎng)賬戶與軟件賬戶不互通，需要單獨(dú)注冊(cè)軟件賬戶。

下載權(quán)限
查看

￥

免費(fèi)下載

評(píng)論并刷新后下載

登錄后下載

查看演示

{{attr.name}}：

您當(dāng)前的等級(jí)為
登錄后免費(fèi)下載登錄小黑屋反思中，不準(zhǔn)下載！評(píng)論后刷新頁(yè)面下載評(píng)論支付以后下載請(qǐng)先登錄您今天的下載次數(shù)（次）用完了，請(qǐng)明天再來(lái) 支付積分以后下載立即支付支付以后下載立即支付您當(dāng)前的用戶組不允許下載升級(jí)會(huì)員

您已獲得下載權(quán)限您可以每天下載資源次，今日剩余次

閃豚速寫AI新產(chǎn)品效果演示視頻

閃豚AI — Mon, 05 Jun 2023 07:02:17 +0000

點(diǎn)擊播放演示視頻

精品www日韩熟女人妻,久久99青青精品免费观看,精品无码国产一区二区三区麻豆

訓(xùn)練閃豚Pro模型過程中，數(shù)據(jù)集的數(shù)量和學(xué)習(xí)率的關(guān)系

學(xué)習(xí)率與數(shù)據(jù)集大小的關(guān)系

【更新】【收費(fèi)工具】自定義關(guān)鍵詞提取批量生成數(shù)據(jù)表

閃豚速寫使用過程報(bào)錯(cuò)/閃退的問題處理解決辦法合集

問題一：預(yù)載模型不完整。

問題二：顯存不足導(dǎo)致的閃退或終止訓(xùn)練報(bào)錯(cuò)。

初步解決方案一：

問題三：繼續(xù)訓(xùn)練剛開始的報(bào)錯(cuò)。

問題四：繼續(xù)訓(xùn)練卻提醒模型訓(xùn)練完成

其他訓(xùn)練報(bào)錯(cuò)問題，后續(xù)完善補(bǔ)充

生成問題一：list index out of range

生成問題二：點(diǎn)擊生成后，就閃退

生成問題三：生成一段時(shí)間后，閃退

星座行業(yè)模型-13.8萬(wàn)學(xué)習(xí)語(yǔ)料，訓(xùn)練129萬(wàn)步

閃豚速寫Pro全功能版安裝包下載

閃豚速寫Pro[出售]

閃豚速寫Pro-月卡[出售]

閃豚速寫LE輕量版安裝包下載

閃豚速寫-輕量版[出售]

閃豚速寫Pro[出售]

閃豚速寫軟件推理生成功能中的參數(shù)調(diào)整說明教程

生成數(shù)據(jù)表格式要求：

閃豚速寫Pro全流程訓(xùn)練指導(dǎo)使用教程

一、軟件安裝工使用

【新手必看教程】閃豚速寫軟件安裝教程以及CUDA和CUDNN安裝教程

二、軟件注冊(cè)激活

1、用戶注冊(cè)

2、軟件激活

三、數(shù)據(jù)處理

1、數(shù)據(jù)的準(zhǔn)備

閃豚速寫Pro訓(xùn)練語(yǔ)料數(shù)據(jù)要求如下：

關(guān)于語(yǔ)料數(shù)量的解釋：

2、工具的使用

閃豚速寫訓(xùn)練數(shù)據(jù)二次篩選強(qiáng)制清洗工具

語(yǔ)料格式、內(nèi)容、編碼清洗小工具[出售]

閃豚AI語(yǔ)料內(nèi)容重復(fù)檢索工具[出售]

3、訓(xùn)練數(shù)據(jù)的處理

四、模型訓(xùn)練

1、參數(shù)說明

2、使用流程

3、中斷訓(xùn)練說明

4、訓(xùn)練其他說明

5、模型訓(xùn)練日志

五、訓(xùn)練功能其他說明

六、生成教學(xué)

1、批量生成數(shù)據(jù)表格式要求：

閃豚AI生成語(yǔ)料數(shù)據(jù)表提取工具

閃豚AI生成數(shù)據(jù)分割小工具

2、為什么要標(biāo)題和起始句，直接使用關(guān)鍵詞載入生成不行？

3、提取完數(shù)據(jù)表后，就可以使用各種批量生成功能

閃豚速寫軟件推理生成功能中的參數(shù)調(diào)整說明教程

4、使用雙標(biāo)題為什么推理會(huì)很慢？

5、圖文功能是怎么樣的？

6、軟件支持標(biāo)題聚合生成

七、其他教學(xué)

閃豚速寫Pro-1.9.1更新說明

一、參數(shù)的優(yōu)化調(diào)整

二、模型的選擇使用

閃豚AI生成數(shù)據(jù)篩查工具

閃豚AI生成數(shù)據(jù)分割小工具

閃豚AI生成語(yǔ)料數(shù)據(jù)表提取工具

關(guān)于模型中斷后繼續(xù)訓(xùn)練說明

閃豚AI刪除TXT指定行數(shù)工具

閃豚AI-V3-221209 - 福利贈(zèng)送（1.99元可享下載體驗(yàn)）

閃豚速寫Pro[出售]

閃豚速寫訓(xùn)練數(shù)據(jù)二次篩選強(qiáng)制清洗工具

關(guān)于生成多線程使用教程

【更新軟件版】【收費(fèi)工具】語(yǔ)料內(nèi)容清洗小工具

語(yǔ)料內(nèi)容清洗小工具功能介紹

優(yōu)勢(shì)介紹

閃豚速寫AI模型發(fā)布交易時(shí)必備語(yǔ)料樣本抽取工具

【推薦】一招教你如何計(jì)算閃豚速寫模型訓(xùn)練成本！

閃豚速寫緩存清除

閃豚速寫Pro私有化模型訓(xùn)練教程

【新手必看教程】閃豚速寫軟件安裝教程以及CUDA和CUDNN安裝教程

閃豚速寫AI新產(chǎn)品效果演示視頻

訓(xùn)練閃豚Pro模型過程中，數(shù)據(jù)集的數(shù)量和學(xué)習(xí)率的關(guān)系

問題一：預(yù)載模型不完整。

問題二：顯存不足導(dǎo)致的閃退或終止訓(xùn)練報(bào)錯(cuò)。

問題三：繼續(xù)訓(xùn)練剛開始的報(bào)錯(cuò)。

其他訓(xùn)練報(bào)錯(cuò)問題，后續(xù)完善補(bǔ)充

生成問題二：點(diǎn)擊生成后，就閃退

生成問題三：生成一段時(shí)間后，閃退

星座行業(yè)模型-13.8萬(wàn)學(xué)習(xí)語(yǔ)料，訓(xùn)練129萬(wàn)步

一、軟件安裝工使用

1、用戶注冊(cè)

2、軟件激活

三、數(shù)據(jù)處理

1、數(shù)據(jù)的準(zhǔn)備

2、工具的使用

語(yǔ)料格式、內(nèi)容、編碼清洗小工具[出售]

3、訓(xùn)練數(shù)據(jù)的處理

四、模型訓(xùn)練

1、參數(shù)說明

3、中斷訓(xùn)練說明

4、訓(xùn)練其他說明

5、模型訓(xùn)練日志

五、訓(xùn)練功能其他說明

1、批量生成數(shù)據(jù)表格式要求：

2、為什么要標(biāo)題和起始句，直接使用關(guān)鍵詞載入生成不行？

3、提取完數(shù)據(jù)表后，就可以使用各種批量生成功能

4、使用雙標(biāo)題為什么推理會(huì)很慢？

5、圖文功能是怎么樣的？

6、軟件支持標(biāo)題聚合生成

七、其他教學(xué)

一、參數(shù)的優(yōu)化調(diào)整

二、模型的選擇使用

【推薦】一招教你如何計(jì)算閃豚速寫模型訓(xùn)練成本！