來源:個人圖書館-追夢文庫
2023-05-31 00:22:46
整個項目包中的路徑 不能有中文,不能有中文,不能有中文, 文件位置 task_menu/task.xlsx。
(相關(guān)資料圖)
數(shù)據(jù)格式如下
- content 是用工具下載抖音短視頻原標題的名稱 - video_id 是處理這個項目的視頻名稱,這個要把對應(yīng)采集的視頻改成這個ID名稱,比如視頻信息是 7196673177487985920-三更說漫丶-不能輪回轉(zhuǎn)世的痛苦 靈異故事 民間故事 漫畫解說 二次元 那么video_id 就是 7196673177487985920,對應(yīng)視頻文件要改成 7196673177487985920.mp4 - collections_name 是視頻合集的名稱,這個可以自定義,如果需要AE編輯配置文件的話這里要用英文。 - en_name 是每個故事的文件夾,這里用英文。 - cn_name 是你給這個視頻重新奇的名稱,可以換成你小說授權(quán)申請的關(guān)鍵詞+視頻故事這樣。 - status 用于管理任務(wù),是一個下拉選項,如果這里選擇已完成,則該行數(shù)據(jù)不會出現(xiàn)在生成任務(wù)重。
前期不會操作的建議一個一個來熟練之后批量操作。 前期不會操作的建議一個一個來熟練之后批量操作。 前期不會操作的建議一個一個來熟練之后批量操作。
整個項目包中的路徑 不能有中文,不能有中文,不能有中文, 文件位置 config 下。
這里設(shè)置用戶名和密碼是購買腳本后管理員發(fā)放的,直接填寫替換掉對應(yīng) 你的用戶名 和 你的密碼 部分的內(nèi)容就好。
UserData = { "username": "你的用戶名", # 填寫你的用戶名 "password": "你的密碼", # 填寫你的密碼}
字幕識別配置,模型選擇根據(jù)自己的機器顯存選擇。
24G顯存建議選擇 large-v2。16G顯存建議選擇 large-v1。8G顯存建議選擇 large。8G以下自己想辦法吧。# 可選項有 "medium","large-v1","large-v2","large"whisper_model = "large-v1"# whisper 路徑# pip install git+https://github.com/openai/whisper.gitwhisper_exe_path = "H:\\MyEnvsProject\\whisper\\Scripts\\whisper.exe"whisper_model_path = "H:\\NovelAI\\UserEdition\\sell_NovelAI_video2video\\whisper_model\\"
這部分暫時沒用。
關(guān)鍵詞分前綴和負面,用于控制你的畫面風格和不想要的畫面。自行在SD中測試好即可,前綴的意思是通過GPT35生成的關(guān)鍵詞會加在tag_prefix后面,進行AI繪畫。
# 繪畫關(guān)鍵詞前綴PROMPT = "best quality ,masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,8k wallpaper, "# 繪畫負面通用詞NEGATIVE_PROMPT = "NSFW,sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, bad anatomy,(long hair:1.4),DeepNegative,(fat:1.2),facing away, looking away,tilted head, {Multiple people}, lowres,bad anatomy,bad hands, text, error, missing fingers,extra digit, fewer digits, cropped, worstquality, low quality, normal quality,jpegartifacts,signature, watermark, username,blurry,bad feet,cropped,poorly drawn hands,poorly drawn face,mutation,deformed,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,extra fingers,fewer digits,extra limbs,extra arms,extra legs,malformed limbs,fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions,gross proportions,text,error,missing fingers,missing arms,missing legs,extra digit, extra arms, extra leg, extra foot,"
視頻分辨率設(shè)置,這里不要超過SD網(wǎng)頁的最大分辨率。同樣視頻最終生成的分辨率也是基于這個。
sd_image_width = 1920 # 圖片寬度sd_image_height = 1080 # 圖片高度
設(shè)置SD繪畫圖像的采樣方法。
sd_sampler = "Euler a" # 生成圖片采樣方法,這里不會改就別動
視頻格式,橫版&豎版。
video_format = "w" # h為豎版,w為橫版
設(shè)置圖片移動的速度,即視頻中圖片關(guān)鍵幀的移動速度。
image_speed = 10 # 這個沒法解釋自己試一下吧
微軟TTS文本轉(zhuǎn)語音,需要自己有一張VISA,不明白是啥自行百度,微軟申請賬號需要。
微軟TTS文本轉(zhuǎn)語音,這里必須選擇eastus服務(wù)器,申請好API之后填寫即可。
# 微軟TTS APIkey# 申請地址 https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech/apiKey = "你的API" # 這里換成你的APIAccessTokenHost = "eastus.api.cognitive.microsoft.com" # 必須選擇 eastus 服務(wù)器
如果自己沒有辦法申請自己的API,可有償提供封裝API,這里就無視即可。
微軟語音選擇,這部分代碼不要動。
# 聲音配置name_dict = {"HiuGaai": "zh-HK, HiuGaaiNeural", "HiuMaan": "zh-HK, HiuMaanNeural", "WanLung": "zh-HK, WanLungNeural", "Xiaoxiao": "zh-CN, XiaoxiaoNeural", "Xiaoyou": "zh-CN, XiaoyouNeural", "Xiaomo": "zh-CN, XiaomoNeural", "Xiaoxuan": "zh-CN, XiaoxuanNeural", "Xiaohan": "zh-CN, XiaohanNeural", "Xiaorui": "zh-CN, XiaoruiNeural", "Yunyang": "zh-CN, YunyangNeural", "Yunye": "zh-CN, YunyeNeural", "Yunxi": "zh-CN, YunxiNeural", "HsiaoChen": "zh-TW, HsiaoChenNeural", "HsiaoYu": "zh-TW, HsiaoYuNeural", "YunJhe": "zh-TW, YunJheNeural"}# 語氣style_dict = {"興奮": "advertisement_upbeat", "高音調(diào)": "affectionate", "厭惡": "angry", "熱情": "customerservice", "冷靜": "calm", "輕松": "chat", "愉快": "cheerful", "憂郁": "depressed", "輕蔑": "disgruntled", "紀錄片": "documentary-narration", "猶豫": "embarrassed", "關(guān)切": "empathetic", "欽佩": "envious", "希望": "excited", "緊張": "fearful", "愉悅": "friendly", "溫和": "hopeful", "優(yōu)美": "lyrical", "朗讀": "narration-professional", "閱讀": "narration-relaxed", "新聞": "newscast", "通用": "newscast-casual", "權(quán)威": "newscast-formal", "快節(jié)奏": "poetry-reading", "悲傷": "sad", "嚴肅": "serious", "高聲": "shouting", "賽事": "sports_commentary", "精彩": "sports_commentary_excited", "柔和": "whispering", "瘋狂": "terrified", "無情": "unfriendly"}role_dict = {"女孩": "Girl", "男孩": "Boy", "年輕的成年女性": "YoungAdultFemale", "年輕的成年男性": "YoungAdultMale", "年長的成年女性": "OlderAdultFemale", "年長的成年男性": "OlderAdultMale", "年老女性": "SeniorFemale", "年老男性": "SeniorMale"}gender_dict = {"男": "Male", "女": "Female"}
上面的格式是這樣的,大括號{ }中以每個,斷開來看,:前面是你要復制的信息,后面是對應(yīng)這個信息的解釋。
例如想使用云希的聲音在name_dict中復制
到下面如何修改在這里這里,其他的依次類推,目前支持自定義修改,但是有的聲音配置可能不支持,比如云希不會有女人聲音這樣,具體慢慢嘗試或者百度即可。
# 設(shè)置配置,這里自行選擇,有的可能無法生成,盡量選擇通用方法是# 發(fā)音人聲音name = name_dict["Yunxi"]# 說話風格style = style_dict["紀錄片"]# 性別gender = gender_dict["男"]audio_rate = "1.4" # 生成音頻的速度 1.4 表示1.4倍,修改""中間的數(shù)字
剪映配置路徑,例如我的路徑是這樣的。
這個路徑也是AE生成配置文件的路徑。
# 剪映需要的完整路徑full_path = "H:\\NovelAI\\User Edition\\sell_NovelAI_txt2video"
這個配置不對,剪映的配置文件會出錯。
這部分內(nèi)容容易被和諧自己看圖吧。
執(zhí)行該腳本是將task_menu/task.xlsx下的未完成的文章進行斷句操作。
會在data_story/下生成你表格中定義的collection_name和en_name文件夾,在該項目下會自動生成一個captions文件夾。
這里是通過whisper進行字幕提取操作。
會生成如下文件。
新建一個文本文件,文件名為 new_ + video_id + .txt。
會在data_story/下生成你表格中定義的collection_name和en_name文件夾,在該項目下會自動生成一個captions文件夾下有一個excel表格。
這個是需要處理的工程文件目錄,不要動這個表格。
會在data_story/下生成你表格中定義的collection_name和en_name文件夾,在該項目下會自動生成一個video_source_img文件夾下對畫面進行截圖然后通過SD重繪。
這里需要自己調(diào)試截取的像素點,在SD.py中配置。
# 設(shè)置截取畫面的坐標# # 提取坐標如果需要x1, y1 = 0, 0 # 左上角像素點x2, y2 =630 , 1280 # 右下角像素點
需要在配置文件中使用你的微軟文字轉(zhuǎn)語音API,使用微軟的API生成語音文件。
會在你生成項目也就是故事的文件夾生成2個目錄audio_wav,each_audio_wav,確保里面的音頻文件都有聲音即可,在生成界面會看到返回結(jié)果為200,即可。
在文件夾下會生成對應(yīng)的音頻文件,腳本設(shè)置的已經(jīng)生成的會跳過,如果音頻文件沒有聲音請刪除重新執(zhí)行腳本。
需要提前打開Stable Diffusion環(huán)境,并開啟API模型。啟動命令行顯示這樣就表示可以了。
在網(wǎng)頁上選擇你需要的模型,之后頁面就可以關(guān)掉了。
啟動腳本即可,會自動的進行繪畫,基于前面API生成的關(guān)鍵詞。生成圖片在data_story/下生成你表格中定義的collection_name和en_name文件夾下生成video_source_sd_img圖片文件。
執(zhí)行該腳本會在data_story/下生成你表格中定義的collction和en_name文件夾下生成data_png圖片文件中隨機挑選一張作為視頻封面,保存在result中。
以上圖片和音頻都生成好了直接點擊該腳本合成視頻。機器不好的不要在task表格中少選幾個,用于一次合成N個視頻,不需要一個一個等待合成。
執(zhí)行該腳本會在data_story/下生成你表格中定義的collection和en_name文件夾下生成result生成一個剪映的配置文件draft_content.json,這個文件仍到你剪映的項目中打開就會看到圖文適配音頻的工程時間軸,方便后期二次加工。
執(zhí)行該腳本會在data_story/下生成你表格中定義的type和en_name文件夾下生成result生成一個剪映的配置文件AE_script.jsx,這個文件仍到你剪映的項目中打開就會看到圖文適配音頻的工程時間軸,方便后期二次加工。
這里的文件路徑不要有中文,建議在第一步切分的時候設(shè)置type中不要有中文
打開AE直接在按照下圖,打開腳本。
然后在編輯主軸中會顯示這樣。
關(guān)鍵詞: