Nghiên cứu tối ưu thay đảo nhiên liệu lò phản ứng hạt nhân VVER-1000

Thursday, 13/10/2022, 00:00

Vấn đề quản lý nhiên liệu trong vùng hoạt

       Quản lý nhiên liệu trong vùng hoạt (In-core Fuel Management - ICFM), cụ thể là tối ưu hóa cấu hình nạp tải nhiên liệu, là một nhiệm vụ quan trọng trong việc thiết kế vùng hoạt lò phản ứng hạt nhân và được thực hiện sau mỗi chu kỳ nhiên liệu đối với hầu hết các lò phản ứng hạt nhân. Cấu hình nạp tải nhiên liệu là sự sắp xếp của các bó nhiên liệu trong vùng hoạt lò phản ứng. Nhiệm vụ chính của ICFM là xác định cấu hình nạp tải nhiên liệu tối ưu. Sự sắp xếp tối ưu có thể mang lại hiệu quả sử dụng nhiên liệu tốt nhất, cho tổng năng lượng được tạo ra trong một chu trình là tối đa mà vẫn đảm bảo yêu cầu an toàn. Trong vùng hoạt lò phản ứng, có nhiều loại bó hợp nhiên liệu với các mức độ làm giàu và độ sâu cháy khác nhau. Do đó, vấn đề tối ưu hóa cấu hình nạp tải là một vấn đề phức tạp với một số lượng lớn các cấu hình có thể xảy ra. Nghiên cứu này tập trung vào việc nghiên cứu và áp dụng phương pháp tiên tiến để tối ưu hóa cấu hình nạp tải nhiên liệu của lò phản ứng VVER-1000, là công nghệ PWR của Nga, đã được xem xét đưa vào chương trình điện hạt nhân của Việt Nam trước năm 2016.

       Vấn đề của bài toán ICFM là không gian tìm kiếm quá lớn (Bảng 1), vì vậy cho đến nay chưa có thuật toán tìm kiếm tối ưu nào có thể xác nhận rằng nghiệm tìm được cuối cùng là nghiệm tối ưu toàn cục. Do đó, các nghiên cứu tối ưu hóa hiện nay tập trung vào việc cải thiện tốc độ hội tụ của quá trình tìm kiếm nhằm tìm ra các nghiệm ngày càng tốt hơn với cùng số phép. Nghiên cứu này sẽ thực hiện tìm hiểu, cải tiến và áp dụng các phương pháp tìm kiếm tối ưu tiên tiến để nâng cao tốc độ hội tụ trong việc giải bài toán tối ưu thay đảo nhiên liệu,  và hai mục tiêu chính là: 

1. Nghiên cứu các phương pháp tìm kiếm tối ưu tiên tiến để áp dụng cho bài toán tối ưu LP của lò phản ứng hạt nhân.

2. Phát triển một công cụ tính toán để tìm kiếm cấu hình nạp tải tối ưu cho lò phản ứng VVER.

Bảng 1: Ước lượng số cấu hình nạp tải và thời gian tính toán tất cả cấu hình đối với lò VVER-1000 nạp tải nhiên liệu MOX

Phát triển các chương trình mô phỏng và phương pháp tìm kiếm tối ưu vùng hoạt lò phản ứng VVER 1000

Phát triển và kiểm chứng chương trình LPO-V:

       Chương trình mô phỏng vùng hoạt (LPO-V) đã được phát triển cho các lò phản ứng VVER, cùng với các phương pháp tìm kiếm tối ưu hóa. Chương trình này giải các phương trình khuếch tán trong ô mạng tam giác dựa trên phương pháp sai phân hữu hạn. Việc xác minh chương trình LPO-V được thực hiện dựa trên một bài toán chuẩn của lò VVER-1000 nạp tải nhiên liệu MOX.

       Hình 1 hiển thị mô hình 1/6 vùng hoạt VVER-1000 MOX với 24 ô mạng tam giác trên mỗi bó nhiên liệu trong chương trình LPO-V. Bộ tiết diện vĩ mô bốn nhóm của bó nhiên liệu được chuẩn bị từ các tính toán ô mạng bằng mô-đun PIJ của hệ chương trình SRAC2006 và thư viện dữ liệu ENDF/B-VII.0

Hình 1. Mô hình vùng hoạt VVER-1000 với 24 ô mạng tam giác trêm mỗi bó nhiên liệu trong chương trình LPO-V

       Tính toán kiểm tra mô-đun mô phỏng vùng hoạt của chương trình LPO-V được tiến hành dựa trên cấu hình tham chiếu của bài toán chuẩn lò VVER-1000 MOX. Bảng 2 so sánh các giá trị k_eff thu được từ chương trình LPO-V với các giá trị từ MCNP4c được trình bày trong bài toán chuẩn. Kết quả so sánh cho thấy hai chương trình có sự thống nhất tốt trong mô phỏng vùng hoạt VVER-1000 MOX.

       Bảng 2. So sánh giá trị k_eff được tính bởi LPO-V và MCNP4c cho năm trạng thái (S1--S5) của bài toán chuẩn lò VVER-1000 MOX

       Việc kiểm tra tốc độ tính toán cũng được thực hiện bằng cách so sánh giữa LPO-V và mô-đun CITATION của chương trình SRAC2006. Thời gian tính toán 2000 cấu hình lò VVER-1000 MOX bằng LPO-V là khoảng 340 giây, nhanh hơn khoảng 3 lần so với mô-đun CITATION của SRAC2006 (1040 giây) với cùng điều kiện tính toán. Như vậy, mô-đun mô phỏng vùng hoạt của LPO-V phù hợp với bài toán tối ưu LP với số lượng cấu hình cần tính toán lớn.

Nghiên cứu và phát triển các phương pháp tìm kiếm tối ưu:

       Hai phương pháp tối ưu hóa tiên tiến đã được phát triển cho bài toán tối ưu nạp tải nhiên liệu của lò phản ứng VVER-1000: Phương pháp mô phỏng tôi kim tiến hóa (ESA) và phương pháp tiến hóa vi phân dựa trên lịch sử thành công (SHADE). Phương pháp ESA được cải tiến từ phương pháp mô phỏng tôi kim nguyên bản (SA) bằng cách sử dụng các toán tử trao đổi chéo và đột biến để tạo ra các cấu hình nạp tải thử nghiệm mới. Phương pháp SHADE sử dụng cơ chế thích ứng dựa trên lịch sử của các tham số điều khiển thành công, tức là tỷ lệ đột biến F và tỷ lệ trao đổi chéo CR, để cải thiện thuật toán tiến hóa vi phân (DE) ban đầu. Do đó, thay vì ba tham số điều khiển trong DE ban đầu, phương pháp SHADE bao gồm hai tham số là kích thước quần thể NP và kích thước bộ nhớ lịch sử H. Để áp dụng phương pháp SHADE cho bài toán tối ưu thay đảo nhiên liệu, phương pháp tiếp cận chỉ số vị trí tương đối đã được triển khai để chuyển đổi các biến thực thành các biến số nguyên. Các tính toán đã được thực hiện để chọn các thông số điều khiển phù hợp của SHADE cho bài toán tối ưu thay đảo nhiên liệu của lò phản ứng VVER-1000 nạp tải MOX.

       Các tính toán số cho bải toán tối ưu thay đảo nhiên liệu của lò VVER-1000 nạp tải MOX đã được thực hiện bằng các phương pháp ESA và SHADE, có so sánh với SA, mô phỏng tôi kim thích ứng (ASA) và DE. Hai hàm mục tiêu được sử dụng để đánh giá hiệu suất các phương pháp cũng như tìm cấu hình tối ưu cho lò VVER:

       Trong đó, hàm mục tiêu F2 đã được chọn để tối đa hóa hệ số nhân neutron hiệu dụng (keff), đồng thời làm phẳng phân bố công suất hướng tâm.

       Để so sánh hiệu suất của SA, ASA và ESA, quá trình tìm kiếm cấu hình nạp tải sử dụng ba phương pháp này trước tiên được thực hiện với hàm mục tiêu $F1$ để tái tạo cấu hình tham chiếu. Kết quả trung bình của 50 lần chạy độc lập được trình bày trong Bảng 3. Kết quả này cho thấy hiệu suất tốt hơn của ESA trong việc tái tạo cấu hình tham chiếu so với SA và ASA.

Bảng 3. So sánh các phương pháp SA, ASA và ESA với hàm mục tiêu F1

Bảng 4 là kết quả của các phương pháp SA, ASA và ESA với hàm mục tiêu $F2$. Có thể thấy rằng các giá trị $F2$ của ESA lớn hơn của SA và ASA với độ lệch chuẩn nhỏ hơn, đồng thời số lượng LP được tính toán trong ESA nhỏ hơn SA và ASA khoảng 5-10 \% trong hầu hết các trường hợp. Các kết quả cho thấy các cấu hình thử nghiệm mới thông qua toán tử trao đổi chéo và đột biến có thể cải thiện hiệu suất của phương pháp ESA trong bài toán tối ưu LP của lò VVER-1000.

Bảng 4. So sánh các phương pháp SA, ASA và ESA với hàm mục tiêu F2

       Với phương pháp SHADE, Tính toán khảo sát được thực hiện để xác định các tham số điều khiển NP và H, trong đó NP thay đổi từ 10 đến 50 với bước 5 và H thay đổi từ 2 đến 10. Hình 2 cho thấy sự phụ thuộc của OF của cấu hình tối ưu theo NP và H. Giá trị phù hợp của NP và H được lựa chọn tại điểm mà OF đạt giá trị lớn nhất. Từ Hình 2, các giá trị NP = 20 và H = 6 đã được chọn cho các tính toán tối ưu LP bằng phương pháp SHADE.

Hình 2. Khảo sát các tham số điều khiển NP và H

       Hai phương pháp ESA và SHADE rời rạc được áp dụng để tìm kiếm cấu hình nạp tải tối ưu cho lò phản ứng VVER-1000 MOX với hàm mục tiêu F2. Với phương pháp ESA, các tính toán được thực hiện với các giá trị alpha là 0,95 và tiêu chuẩn hội tụ bổ sung là 10000. Hình 3 (a) cho thấy sự phát triển của hàm mục tiêu của lò VVER-1000 MOX trong quá trình tìm kiếm với 3 phiên bản ESA, SA và ASA. Kết quả cho thấy ESA có thể tìm được cấu hình có giá trị hàm mục tiêu tốt nhất. Với phương pháp SHADE, Hình 3 (b) mô tả sự phát triển của giá trị OF trung bình theo số thế hệ tính toán. Kết quả cho thấy lợi thế của các cấu hình được chọn ở mỗi thế hệ so với các cấu hình thử nghiệm. Ngoài ra, giá trị OF trung bình của các cấu hình tốt nhất thường tốt hơn trung bình của các cấu hình được chọn trong thế hệ.

Hình 3. Sự phát triển của OF trong phương pháp ESA (a) và SHADE (b)

       Kết quả tìm kiếm cho thấy các cấu hình tối ưu được tìm thấy bởi ESA và SHADE là giống hệt nhau. Cấu hình tối ưu cókeff lớn hơn của cấu hình tham chiếu khoảng 1834 pcm. Trong khi đó, hệ số đỉnh công suất xuyên tâm (PPF) của cấu hình tối ưu nhỏ hơn khoảng 2,4 % so với cấu hình tham chiếu (Bảng 5 và Hình 4). Sự khác biệt thống kê giữa các phương pháp này cũng được đánh giá dựa trên phương pháp Mann-Whitney U-test. Kết quả cho thấy rằng phương pháp ESA và SHADE có hiệu suất tương đương với DE và lợi thế hơn so với SA và ASA.

Bảng 5. So sánh các thông số cơ bản của cấu hình tham chiếu và cấu hình tối ưu tìm được

Hình 4. So sánh cấu hình tham chiếu và cấu hình tối ưu tìm được (a) và phân bố công suất của chúng (b)

Những kết quả nổi bật của nghiên cứu

       Các nghiên cứu nhằm mục đích phát triển các phương pháp tìm kiếm tối ưu tiên tiến, cụ thể là ESA và SHADE, và áp dụng cho bài toán ICFM của lò phản ứng VVER-1000. Những kết quả nổi bật đạt được đó là:

(1) Phát triển chương trình LPO-V để tính toán các đặc trưng vật lý của lò phản ứng VVER với tốc độ tính toán nhanh và độ chính xác đảm bảo. Chương trình này được kết hợp với các phương pháp tìm kiếm tối ưu mới được phát triển để giải quyết bài toán ICFM của lò phản ứng VVER-1000.

(2) Phát triển các phương pháp tìm kiếm tối ưu tiên tiến ESA và SHADE đã được tiến hành và áp dụng thành công cho bài toán tối ưu LP của lò phản ứng VVER-1000. ESA là một phiên bản cải tiến của phương pháp SA ban đầu, được đề xuất bởi nghiên cứu sinh. Thay vì sử dụng toán tử trao đổi nhị phân / bậc ba để tạo cấu hình thử nghiệm mới như trong SA, ESA đã sử dụng toán tử trao đổi chéo cho hai cấu hình cơ sở để tạo cấu hình thử nghiệm mới. Phương pháp SHADE là phiên bản nâng cao của phương pháp DE với việc sử dụng tính năng thích ứng dựa trên lịch sử thành công để xác định các tham số điều khiển $F$ và $CR$ một cách tự động. Phương pháp RPI đã được áp dụng để chuyển đổi vectơ thực sang vectơ nguyên trong phương pháp SHADE rời rạc. Đây là nghiên cứu đầu tiên áp dụng phương pháp SHADE cho bài toán ICFM.

(3) Các tính toán tối ưu LP cho lò phản ứng VVER-1000 MOX được thực hiện bằng các phương pháp ESA và SHADE so sánh với các phương pháp khác. So sánh giữa ESA, SA và ASA cho thấy ESA có hiệu suất cao hơn SA và ASA trong bài toán tối ưu LP. So sánh các phương pháp ESA, DE và SHADE cho thấy ba phương pháp này có hiệu suất tương đương. Tuy nhiên, ưu điểm của SHADE là cơ chế thích ứng đơn giản hóa đáng kể việc xác định các tham số điều khiển so với DE.

Các cấu hình tối ưu được chọn từ phương pháp SHADE và ESA là giống nhau. Cấu hình này có sự cải thiện đáng kể về giá trị $k_{eff}$ (lớn hơn giá trị của cấu hình tham chiếu khoảng 1580 pcm). Trong khi đó, $PPF$ nhỏ hơn giá trị tham chiếu khoảng 2,4 \% và giá trị độ phẳng của phân bố công suất là gần như nhau. Kết quả chứng minh rằng các phương pháp ESA và SHADE rời rạc đã được phát triển và áp dụng thành công để tối ưu hóa việc nạp nhiên liệu của lò phản ứng VVER-1000.

Các định hướng nghiên cứu tiếp theo

(1) Chương trình LPO-V sẽ được nâng cấp để mô phỏng lò phản ứng 3D với các ô mạng hình tam giác và hình chữ nhật và thực hiện được tính toán cháy.

(2) Nghiên cứu sâu hơn về các phương pháp ESA, SHADE và các phương pháp tiên tiến mới đang được lên kế hoạch. Việc mở rộng nghiên cứu này sang tối ưu hóa đa chu trình cũng được tính đến.

(3) Việc mở rộng áp dụng các phương pháp này cho bài toán tối ưu LP và thiết kế vùng hoạt cho các loại lò phản ứng khác cũng đang được tìm hiểu và thực hiện.

Các công trình công bố có liên quan của tác giả và công sự

[1] Viet-Phu Tran, Giang T.T. Phan, Van-Khanh Hoang, Haidang Phan, Nhat-Duc Hoang, Hoai-Nam Tran; Success-history based adaptive differential evolution method for optimizing fuel loading pattern of VVER-1000 reactor; Nuclear Engineering and Design 377 (2021) 111125

[2] Viet-Phu Tran, Giang T.T. Phan, Van-Khanh Hoang, Pham Nhu Viet Ha, Akio Yamamoto, Hoai-Nam Tran; Evolutionary simulated annealing for fuel loading optimization of VVER-1000 reactor; Annals of Nuclear Energy 151 (2021) 107938

[3] Viet-Phu Tran, Hoai-Nam Tran, Akio Yamamoto, Tomohiro Endo; Automated Generation of Burnup Chain for Reactor Analysis Applications; Kerntechnik, ISSN 0932-3902, 82 (2017 ) 2 196-205.

[4] Viet-Phu Tran, Hoai-Nam Tran, Van Khanh Hoang; Application of Evolutionary Simulated Annealing Method to Design a Small 200 MWt Reactor Core; Nuclear Science and Technology, ISSN 1810-5408, Vol. 10, No. 4 (2020), pp. 16-23

[5] Nguyen Huu Tiep, Nguyen Thi Dung, Tran Viet Phu, Tran Vinh Thanh and Pham Nhu Viet Ha; Burnup calculation of the OECD VVER-1000 LEU benchmark assembly using MCNP6 and SRAC2006; Nuclear Science and Technology, ISSN 1810-5408, Vol. 8, No. 4 (2018), pp. 10-19

[6] Tran Vinh Thanh, Tran Viet Phu, Nguyen Thi Dung; A study on the core loading pattern of the VVER-1200/V491; Nuclear Science and Technology, ISSN 1810-5408, Vol. 7, No. 1 (2017), pp. 21-27.

[7] Tran Viet Phu, Tran Hoai Nam; Discrete SHADE method for in-core fuel management of VVER-1000 reactor;  45th Vietnam Conference on Theoretical Physics (VCTP-45), 2020 (Poster)

[8] Viet-Phu Tran, Hoai-Nam Tran, Van Khanh Hoang; Application of Evolutionary Simulated Annealing Method to Design a Small 200 MWt Reactor Core; 6th Conference on Nuclear Science and Technology for young researcher, 08-09/10/2020.

Viện Khoa học và Kỹ thuật hạt nhân

Lượt xem: 5258