前言:本站為你精心整理了談離散型制造業(yè)生產(chǎn)能力平衡技術(shù)范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
關(guān)于虛擬企業(yè)的生產(chǎn)任務(wù)分配研究的報道有[1][1]等,關(guān)于生產(chǎn)計劃執(zhí)行,人力分配的研究報道有[3][4]等,而關(guān)于基于實際生產(chǎn)能力,對生產(chǎn)任務(wù)進行快速均衡分配的研究報道較少。本文探討將所有工作中心的總工作負荷進行動態(tài)統(tǒng)計掌握,然后將工作中心的能力和生產(chǎn)任務(wù)進行匹配,平衡后產(chǎn)生適應(yīng)負荷的詳細生產(chǎn)計劃,對超出能力負荷的生產(chǎn)任務(wù)進行選擇外協(xié)。該方法將促進制造業(yè)的生產(chǎn)計劃合理化、精準化,從而最大發(fā)揮生產(chǎn)資源的效率,增加制造業(yè)的經(jīng)濟效益。
離散型制造業(yè)生產(chǎn)能力均衡模型
生產(chǎn)計劃下達模式問題分析生產(chǎn)計劃與調(diào)度是生產(chǎn)控制的關(guān)鍵,它的科學性及優(yōu)化程度,直接影響生產(chǎn)效率。現(xiàn)在,一般中等規(guī)模制造型企業(yè)的生產(chǎn)管理部常常接到成千上萬生產(chǎn)訂單(生產(chǎn)零件),憑經(jīng)驗分開轉(zhuǎn)遞外協(xié)生產(chǎn)或者自制,如圖1。這種主要靠人工經(jīng)驗組織生產(chǎn)的模式,未根據(jù)生產(chǎn)資源約束,最優(yōu)處理自制與外協(xié)的關(guān)系。本文采用改進后的生產(chǎn)組織模式,擯棄整個生產(chǎn)過程采用經(jīng)驗主義,而是建立在理性的推算基礎(chǔ)上,將瓶頸工序外協(xié)制造,擴大產(chǎn)能。
生產(chǎn)計劃下達模式改進本文采用優(yōu)化模式[5]——揀選后直接下達到工作中心,如圖2,其最關(guān)鍵的技術(shù)是經(jīng)過科學計算后再判斷,然后分流訂單到外協(xié)加工。該模式采用兩步優(yōu)化的辦法:首先生產(chǎn)部接到訂單后,將其分為必須外協(xié)件,必須自制件和可外協(xié)可自制件三類。然后用算法將必須自制件和可自制可外協(xié)件約束于各工作中心的產(chǎn)能,進行匹配選擇,基本符合產(chǎn)能的訂單用于自制,超出產(chǎn)能的訂單和必須外協(xié)件外協(xié)加工。然后,將下達到各車間或者工作中心的工件進行優(yōu)化排產(chǎn)。該模式是兩階段優(yōu)化,優(yōu)點是將復雜問題進行了分解,對算法的要求相對較低,優(yōu)化效果也較好,并且車間管理的靈活度較大,可以積極應(yīng)對各種突發(fā)事件,校正計劃的偏差;其缺點是生產(chǎn)部的大計劃變更不方便,對車間的生產(chǎn)情況監(jiān)控比較弱。改進的下單模式能起到“防洪抗旱”作用,均衡任務(wù)。備注:如圖2虛線疊加部分所示,“軟件系統(tǒng)優(yōu)化排程”的動作可以是生產(chǎn)管理部或生產(chǎn)制造執(zhí)行部門做,但必須根據(jù)實時動態(tài)產(chǎn)能等資源優(yōu)化排產(chǎn)。
生產(chǎn)任務(wù)均衡下達模型生產(chǎn)管控業(yè)務(wù)過程比較復雜,生產(chǎn)環(huán)境相關(guān)的各種因素經(jīng)常發(fā)生變化,各種不確定性的事件經(jīng)常發(fā)生等等,也使得生產(chǎn)部計劃不確定,也導致車間生產(chǎn)調(diào)度問題更加復雜。作者提出基于產(chǎn)能的計劃制定模式,然后把訂單下達至車間或者生產(chǎn)中心,具體排產(chǎn)調(diào)度由車間自己用算法根據(jù)生產(chǎn)現(xiàn)場實際再優(yōu)化,該方法稱為揀選后直接下達到工作中心的計劃模式,下面詳細介紹。為了說明方便,使用部分假設(shè)條件。設(shè)車間當前序的產(chǎn)能為[,,,]12mNAAA,m為工作中心或設(shè)備數(shù)目;有n種訂單需要加工,其交貨期幾乎相同,訂單j的工序需要在機器i上加工,如訂單的加工機器矩陣S描述,列為工件,行為機器/序,工件j有jc個;工件j的工序在機器i上加工需要的時間如加工時間矩陣T描述。
優(yōu)化產(chǎn)能均衡的學習算法設(shè)計
基本強化學習算法概述強化學習[7][8][9]是一種有效的機器學習方法,通過與環(huán)境的交互,經(jīng)過試探與評價,實現(xiàn)從環(huán)境到動作的映射的學習方法,目標是使長期獎勵信號最大。由于外部環(huán)境提供信息較少,強化學習的學習效率通常較低。Q-學習算法由Watkins于1989年提出的,類似于動態(tài)規(guī)劃算法的一種強化學習方法,通過與環(huán)境交互,學習最優(yōu)行動策略[10]。Q-學習的目標是學習在動態(tài)環(huán)境下如何根據(jù)外部評價信號來選擇較優(yōu)動作或者最優(yōu)動作,本質(zhì)是一個動態(tài)決策的學習過程。Q-學習中,每個Q(s,a)對應(yīng)一個相應(yīng)的Q值,在學習過程中根據(jù)Q值,選擇動作。Q值的定義是如果執(zhí)行當前相關(guān)的動作并且按照某一個策略執(zhí)行下去,將得到的回報的總和。最優(yōu)Q值可表示為Q*,其定義是執(zhí)行相關(guān)的動作并按照最優(yōu)策略執(zhí)行下去,將得到的回報的總和。關(guān)于Q-學習算法的研究成果較多[11],如文獻[12]針對標準強化學習學習由于缺乏環(huán)境信息,致使算法速度慢的問題,在標準的Q-學習算法的基礎(chǔ)上,加入有效的經(jīng)驗知識,提出基于經(jīng)驗知識的Q-學習算法。文獻[13]提出了新的多智能體學習算法,通過對聯(lián)合動作的統(tǒng)計來學習其它智能體的行為策略,并利用智能體策略向量的全概率分布保證了對聯(lián)合最優(yōu)動作的選擇。學習算法廣泛應(yīng)用于優(yōu)化[14]、智能控制[15]、機器人、智能交通[16]和多智能體系等領(lǐng)域。
新學習算法原理描述自然界的生物在殘酷的優(yōu)勝劣汰法則下不斷完善自己以適應(yīng)環(huán)境,這就是生物的學習能力。通過學習,生物不斷調(diào)整自身的狀態(tài)來適應(yīng)環(huán)境,并通過繼承的積累使好的信息傳遞到后代。強化學習算法雖具有強大的應(yīng)用范圍,仍有其局限性,它應(yīng)用于解決離散型生產(chǎn)調(diào)度問題的報道較少,特別應(yīng)用于解決離散型制造業(yè)生產(chǎn)任務(wù)按照負荷分配幾乎未見報道。本文針對離散制造業(yè)生產(chǎn)實際,提出新的學習算法,并將其應(yīng)用于生產(chǎn)任務(wù)分配。該文的新學習算法,它的核心思想是基于哲學上的“近朱者赤,近墨者黑”的原理,也就是讓潛在解不斷的向較優(yōu)解學習,學習過程中吸取它的優(yōu)良基因,從而不斷改善解。學習算法也借鑒了GA部分思想,若采用“整數(shù)編碼”,學習其實就與好解(GA的染色體)交叉。該新的學習算法也是一種基于迭代的優(yōu)化工具,系統(tǒng)初始化為一組隨機解,通過迭代搜尋最優(yōu)值。在學習算法中,我們將潛在解稱為“學子”,學子在解空間追隨最優(yōu)的學子進行搜索。必須注意的是在學習過程中不能拋棄向優(yōu)秀同事學習這一種重要方式。這種優(yōu)秀學子的知識(歷史最優(yōu)解)信息代代相傳,自然地形成了全局最優(yōu)解的軌跡,對這些全局最優(yōu)解進行模式抽取,即可得到全局最優(yōu)模式。而全局最優(yōu)模式是迭代搜索所需的極其有用的知識信息,利用全局最優(yōu)模式可以對學子集體空間的進一步求解提供有效指導,從而加快算法的收斂速度。
總結(jié)
近些年來,關(guān)于生產(chǎn)調(diào)度的研究較多,解決生產(chǎn)調(diào)度的算法也較多,但因生產(chǎn)調(diào)度是NP難的組合優(yōu)化問題,優(yōu)化時的收斂速度較慢,耗費時間及存儲資源較多,還沒一種算法能適應(yīng)各種復雜的調(diào)度問題。關(guān)于生產(chǎn)計劃及其任務(wù)均衡分配的報道較少。本文深入探討了基于生產(chǎn)能力負荷的生產(chǎn)任務(wù)分配問題,能最大限度地發(fā)揮產(chǎn)能。并提出了LA算法,采用了新的0-1編碼,成功應(yīng)用于解決生產(chǎn)任務(wù)均衡分配問題,數(shù)據(jù)仿真實驗驗證該算法收斂速度較快,且容易趨向全局最優(yōu)解。未來將深入研究LA的其它模型用于優(yōu)化問題的特性區(qū)別,效率差異;LA為初次提出,關(guān)于它的理論意義還沒深入討論。將來的工作一方面需要完善其理論意義;另一方面將其應(yīng)用與連續(xù)函數(shù)優(yōu)化問題,分配問題、TSP等其它組合優(yōu)化問題,并進一步深入研究在其它領(lǐng)域的應(yīng)用。
作者:連志剛焦斌高葉軍單位:上海電機學院電子信息學院