Cổng tri thức PTIT

Bài báo quốc tế

Lĩnh vực nổi bật

Trí tuệ nhân tạo

Trí tuệ nhân tạo

1.089

Internet vạn vật

Internet vạn vật

23

An toàn bảo mật

An toàn bảo mật

11

Blockchain

Blockchain

3

Tìm kiếm theo

Năm xuất bản
Lĩnh vực bài báo

Kho tri thức

/

Bài báo quốc tế

Sắp xếp theo

Huỳnh Trọng Thưa
Machine-learning malware detectors achieve near-perfect deployment accuracy yet silently degrade as threats evolve. We present a multi-dataset temporal study of this concept drift on 1.68 million Portable-Executable samples from EMBER 2017, EMBER 2018, and BODMAS (2019–2020), unified in the EMBER v2 feature space and analyzed with three classifier families (LightGBM, Random Forest, MLP) across nine experimental dimensions: in-era baselines, cross-era transfer, monthly drift tracking, incremental retraining, family-level false-negative decomposition, feature-group sensitivity, cumulative Area-Under-Time (AUT) analysis, drift-triggered retraining (ADWIN, DDM), and active-learning sample selection, with 10-seed statistical validation. Six findings emerge. (1) Forward degradation is asymmetric: under a strict appeared-year split, training on 2017 data loses 8.47 percentage points (pp) F1 on 2018 data (LightGBM, 10 seeds), whereas the reverse direction shows no degradation. (2) Unseen malware families dominate failures, with false-negative rates up to 23.92% and same-month ratios exceeding 30× relative to known families in the strongest case. (3) Cross-era robustness is feature-group dependent: SectionInfo and ImportsInfo dominate transfer (+0.85 and +0.37 pp respectively when retained), while HeaderFileInfo and StringExtractor act as temporal artifacts—zeroing them improves cross-era F1 by 0.67 and 0.47 pp respectively. (4) Incremental retraining with only 1% newly labeled data gains +0.56 pp cumulative AUT over a static baseline. (5) ADWIN/DDM-triggered retraining matches that AUT within 0.07–0.13 pp on LightGBM while issuing ∼33–35% fewer retrains, exposing a label-budget vs. accuracy trade-off. (6) Uncertainty sampling delivers a +0.76 pp AUT improvement over random sampling at identical labeling cost (p = 0.0020, Wilcoxon). Together the results form a five-way mitigation ladder—static, fixed 1%/month, ADWIN-triggered, DDM-triggered, and uncertainty-sampled—that practitioners can position along their labeling-budget and AUT requirements.

Năm:2026

|

Chủ đề: Khoa học máy tính và thông tin

|

Nhà xuất bản: IEEE Access

Huỳnh Trọng Thưa
Iris segmentation remains a critical yet challenging stage in biometric recognition, especially under offaxis capture, eyelid and eyelash occlusion, specular reflections, and illumination variations that violate the circular and unobstructed assumptions of classical pipelines. We present EDIL-SegRayDP, a training-free and explainable iris segmentation framework that departs from the conventional localization-first paradigm by treating annulus recovery as the primary optimization objective. Rather than committing early to a global center/radius hypothesis and refining it afterward, the proposed method performs segmentation-first boundary recovery with segmentation-aware center rescue and fail-safe outer-boundary control. Occlusion is handled explicitly through geometry-normalized masking and validity-aware annulus construction, while all key parameters are defined in scale-normalized form for cross-dataset portability. Experiments under a fixed-configuration protocol on IITD and CASIA-IrisV4-Interval show strong non-CNN performance with CPU-only inference, achieving an iris-mask mean Dice of 0.9106 on IITD and 0.9377 on CASIA-IrisV4- Interval, with corresponding pupil Dice of 0.9763 and 0.9755. Additional full-benchmark evaluations on CASIA-IrisV4-Lamp and CASIA-IrisV4-Thousand further confirm the portability of the proposed framework across more challenging and larger-scale subsets. Under the evaluation protocol adopted in this study, these results compare favorably with a recent training-free reference, supporting EDIL-SegRayDP as a competitive and interpretable training-free alternative for iris segmentation under non-ideal imaging conditions

Năm:2026

|

Chủ đề: Khoa học máy tính và thông tin

|

Nhà xuất bản: EAI Endorsed Transactions on Industrial Networks and Intelligent Systems

Huỳnh Trọng Thưa
This paper proposes RadialSwin-UNet, a lightweight iris-specific segmentation framework that builds upon Swin-based modeling and incorporates topology-aligned polar representation for robust iris delineation under occlusion and illumination variation. Instead of operating purely in the Cartesian plane, our method adopts a compact polar representation that matches the iris’ radial–angular geometry, allowing the model to capture global circular structure more naturally. A crop-based polar unwrapping focuses computation on the iris region and stabilizes radial–angular topology for efficient attention modeling, while anatomically informed priors encourage ring-consistent predictions under occlusion and illumination variation. Experiments on CASIA-IrisV4-Interval, CASIA-IrisV4-Lamp, and IITD show that the proposed method provides a favorable accuracy–efficiency trade-off, achieving a Dice score of 0.9885 on CASIA-IrisV4-Interval while using 13× fewer parameters than U-Net (2.4 M vs. 32 M), together with 3.4× faster training and 1.9–3.2× faster inference. These results suggest that the proposed method is a promising candidate for efficient biometric deployment under limited computational resources.

Năm:2026

|

Chủ đề: Khoa học máy tính và thông tin

|

Nhà xuất bản: IEEE Open Journal of the Computer Society

Huỳnh Trọng Thưa
Deep iris recognition models are often trained on Cartesian grids, whereas iris texture follows a concentric structure with angular periodicity. This representational mismatch can weaken rotation robustness and limit pupil-to-limbus context modeling, while many pipelines still rely on accurate segmentation masks. We propose RadialFormer, an efficient mask-free iris recognition framework that performs representation learning directly in the polar domain. The pipeline first estimates pupil/iris parameters (cx , cy, rin, rout) using a percentile radial-gradient operator with anatomical constraints, and then applies a crop-based polar transform to obtain a compact 64 × 512 unwrapped iris map. To better match polar geometry, we introduce Learnable Polar Position Encoding (LPPE) with separable radial–angular embeddings, where Fourier terms in the angular branch enforce continuity at θ = 0/2π. We further propose Radial Stripe Window Attention (RSWA), which computes self-attention within full-height radial stripes and uses modular angular shifting to preserve circular consistency. Trained end-to-end with batch-hard triplet loss under P × K sampling, RadialFormer achieves 99.04% TPR@1%FPR with 0.48% EER on CASIA-V4-Lamp, and 93.63% TPR@1%FPR with 2.92% EER on CASIA-V4-Interval. Ablation and cross-dataset evaluations further validate the contributions of polar processing, LPPE, and RSWA and demonstrate robust generalization across acquisition conditions. Under the same input resolution, RadialFormer reduces computation by about 3.5× compared with a standard transformer baseline while maintaining competitive recognition accuracy.

Năm:2026

|

Chủ đề: Khoa học máy tính và thông tin

|

Nhà xuất bản: Computer Modeling in Engineering & Sciences

Nguyễn Hoàng Dương
AI recommendation systems are reshaping sustainable consumption in digital marketplaces, yet the psychological mechanisms governing consumer adoption remain underexplored in emerging economies. This study investigates consumer intention to adopt AI recommendation systems for sustainable consumption in Vietnam, drawing on an integrated framework combining the Information Systems Success (ISS) model, human-computer interaction (HCI) principles, UTAUT2, and Cognitive Dissonance Theory (CDT). Algorithmic trust and affective attitude are positioned as dual mediating pathways, with the AI-Environment Paradox incorporated as a formal moderating boundary condition. A structured survey of 403 e-commerce users was analyzed using PLS-SEM. System quality emerges as the strongest predictor of cognitive trust, while personalization exerts the greatest influence on attitude. Attitude is the dominant driver of behavioral intention, substantially outperforming trust and social influence. Performance expectancy and facilitating conditions yield negligible effects, reflecting the post-normalization of AI usage among digitally native consumers. Notably, the AI-Environment Paradox operates asymmetrically, attenuating the trust-to-intention pathway while amplifying the attitude-to-intention link through compensatory pro-environmental reasoning, a pathway-specific moderation effect that extends CDT into the domain of AI-assisted sustainable consumption. These findings reframe adoption logic for sustainable AI commerce and carry actionable implications for platform design, personalization strategy, and ecological communication in high-penetration digital economies.

Năm:2026

|

Chủ đề: Trí tuệ nhân tạo

|

Nhà xuất bản: Journal of Promotion Management

Grerkiat Korbuakaew
Phương pháp điều khiển dựa trên bộ quan sát nhiễu được công nhận là một trong những hướng tiếp cận đầy hứa hẹn để giảm thiểu tác động của nhiễu, và đã có nhiều công trình nghiên cứu về các phương pháp thiết kế loại bộ quan sát này được công bố. Gần đây, việc tham số hóa toàn bộ các bộ quan sát nhiễu dành cho các đối tượng chịu tác động của nhiễu bất kỳ đã được làm sáng tỏ. Tuy nhiên, các phương pháp này thường đòi hỏi phải biết trước tín hiệu điều khiển. Do tồn tại những hệ thống mà tín hiệu điều khiển không khả dụng, việc thiết kế các bộ quan sát nhiễu với đầu vào chưa biết là vô cùng cần thiết. Trong bài báo này, chúng tôi làm rõ việc tham số hóa toàn bộ các bộ quan sát nhiễu đầu vào chưa biết dành cho các đối tượng chịu tác động của nhiễu đầu ra ngoại lai tổng quát. Đồng thời, chúng tôi cũng trình bày một phương pháp thiết kế áp dụng cho các bộ quan sát loại này.

Năm:2026

|

Chủ đề: Kỹ thuật điện tử và viễn thông

|

Nhà xuất bản: International Journal of Innovative Computing, Information and Control

Vũ Sơn Tùng
Synthesizing photorealistic talking head videos from single facial images and speech audio presents significant challenges in modeling natural head motion dynamics, ensuring temporal coherence, and preserving subject identity under computational constraints. Current diffusion-based approaches face deployment limitations due to computationally intensive training and large-scale dataset requirements, while efficient NeRF-based methods require hours of person-specific training per subject. This paper introduces LiveNeRF, a structural redesign of Efficient Region-aware Neural Radiance Fields (ER-NeRF) that integrates face replacement capabilities directly within the model architecture. We position this as an architectural contribution: rather than proposing new algorithmic components, we demonstrate that restructuring an existing ER-NeRF model by removing its person-specific output head and replacing it with face manipulation modules (a motion extractor, keypoint-based warping network, and identity decoder) yields measurable practical benefits over both the original model and naive two-stage combinations of the same components. The resulting architecture is a single, cohesive neural model in which the ER-NeRF backbone produces a pre-output-head intermediate representation that retains audio-conditioned motion information from volume rendering; this representation is then directly processed by the appended face manipulation modules within the same forward pass, bypassing the original output head that would produce a person-specific image. This structural redesign eliminates the need for person-specific training by leveraging pretrained motion priors, enabling zero-shot synthesis from a single reference image. Our evaluation demonstrates competitive visual quality (PSNR: 33.05 dB, LPIPS: 0.0315, FID: 10.65), effective lip synchronization (Sync: 5.680, LMD: 2.765), and real-time performance (33 FPS), establishing LiveNeRF as a practical solution for talking head synthesis.

Năm:2026

|

Chủ đề: Kỹ thuật thông tin

|

Nhà xuất bản: Computer Vision and Image Understanding

Dương Thị Thanh Tú
Artificial intelligence (AI), particularly machine learning (ML), has become a key technology in antenna design due to its ability to model nonlinear relationships between antenna dimensions and performance. ML enables accurate prediction of antenna performance parameters based on input dimensions, reducing optimization time and the number of simulations compared to traditional methods. However, some existing studies still face limitations such as small datasets, high prediction errors, or complex and manual data processing procedures. This study proposes a data processing method on Google Colab to rapidly and accurately construct training datasets for machine learning. Based on a dataset of 15,000 samples created by this method, the Gradient Boosting (GB) model is used to predict antenna performance with a mean squared error (MSE) of 0.2914, demonstrating high prediction accuracy and low error, thereby significantly reduce simulation and antenna design optimization time.

Năm:2026

|

Chủ đề: Trí tuệ nhân tạo

|

Nhà xuất bản:

Nguyễn Việt Hưng
LoRa communication is currently gaining significant research attention globally for various applications, such as the Internet of Things (IoT) owing to its long-range transmission and energy-efficient characteristics. Meanwhile, Software-Defined Radio (SDR) technology, with its flexible customization and rapid adaptability for diverse radio applications, fully meets the requirements of such communication systems. While mulation studies and commercial deployments exist, there is a lack of reports that integrate theoretical evaluation with experimental validation on SDR platforms, particularly those incorporating a real-time monitoring framework. This paper presents a complete LoRa testbed based on ADALM-PLUTO and GNU Radio, which integrates a real-time dashboard using Node-RED, MQTT, and Database Management System (DBMS). The research methodology comprises two parts: (i) Monte Carlo simulations over an AWGN channel to establish a theoretical Bit Error Rate (BER) vs. Signal-to-Noise Ratio (SNR) baseline for various Spreading Factors and Coding Rates, combined with Time-onAir calculation; and (ii) experimental BER/Packet Error Rate (PER) measurements on the SDR platform to compare against the theoretical baseline and assess real-world performance. The real-time dashboard enables the monitoring and control of message transmission/reception, bservation of signal strength, and real-time tracking of the packet error rate

Năm:2026

|

Chủ đề: Trí tuệ nhân tạo

|

Nhà xuất bản:

Lê Hà Trang
The dynamic interaction between macroeconomic factors and stock market performance is a central concern in financial decision-making. This study examines the short-term and long-term effects of selected macroeconomic variables, the Consumer Price Index (CPI), USD/VND exchange rate, gold price, WTI crude oil price, and Brent crude oil price, on the Vietnamese stock market, proxied by the VN Index. Using monthly data (January 2010–December 2023) for long-term analysis and daily data for short-term analysis, the study employs a comprehensive econometric framework including the Augmented Dickey–Fuller stationarity test, Johansen cointegration test, Granger causality test, Vector Autoregression (VAR) model, and the Autoregressive Distributed Lag (ARDL) model. The findings reveal that in the short run, CPI, WTI oil price, and Brent oil price exert significant impacts on the VN Index, whereas the USD/VND exchange rate and gold price do not produce immediate effects. In the long run, the ARDL model indicates a negative relationship between CPI and the VN Index, a mild lagged influence from the exchange rate, and a complex, nonlinear effect of Brent oil prices. These results offer actionable insights for investment decision-making: investors should closely monitor inflation and oil price movements to adjust portfolio strategies, while policymakers should prioritize effective inflation control and exchange rate management to enhance stock market stability. By identifying which macroeconomic variables carry predictive power for stock market fluctuations, this study contributes empirical evidence to support more informed and resilient financial decision-making in emerging market contexts.

Năm:2026

|

Chủ đề: Trí tuệ nhân tạo

|

Nhà xuất bản: Decision Science Letters

Ma Công Thành
Wood species identification is essential for forestry monitoring and biodiversity conservation, yet remains challenging owing to high inter-class similarity and strong intra-class variation in macroscopic wood images. Convolutional Neural Networks (CNNs) effectively capture local anatomical patterns, whereas Vision Transformers (ViTs) model long-range spatial dependencies but can be sensitive to surface noise and repetitive textures. Existing hybrid CNN–Transformer approaches mainly rely on parallel pro- cessing and generic feature fusion, without explicitly reflecting the hierarchical local-to-global perception strategy employed by human wood taxonomists. In this paper, we propose WiT, an effective wood species identification framework based on a perception-aligned sequential hybrid CNN–Transformer architecture with a Query-Guided Cross-Attention (QGCA) module. WiT first extracts refined local anatomical features using a CNN backbone and then performs global structural modeling with a transformer encoder; this alignment with expert inspection is architectural in nature rather than formally enforced. A query- guided attention module adaptively integrates local and global representations, emphasizing discriminative anatomical cues while reducing the influence of irrelevant surface artifacts. Extensive experiments on six macroscopic wood datasets, including the newly curated IC4SD-VN99 benchmark, show that WiT achieves an average accuracy of 98.37% and a macro F1-score of 98.12% (mean ±std across three independent random seeds). Across the evaluated benchmarks, WiT provides competitive and stable performance, outperforming all ablation variants in accuracy and in F1-score on five of six datasets, with a negligible difference on IC4SD-VN99 (< 0.01 pp). With an inference latency of 11.95 ms on an NVIDIA L4 GPU (batch size = 1) at a computational cost of 13.33 GFLOPs and 52.96 M parameters, the proposed framework offers a practical balance between recognition performance and efficiency for laboratory-grade forestry applications.

Năm:

|

Chủ đề: Khoa học máy tính và thông tin

|

Nhà xuất bản: IEEE Access

Nguyễn Trọng Khánh
Automated wood surface defect detection is difficult to evaluate reliably because defects are often small, low-contrast, and visually confounded by natural wood texture, while reported performance can vary substantially with benchmark design and domain shift. To address this issue, we conduct a comparative study across three practically relevant settings: a curated seven-class benchmark, a broader in-domain seven-class protocol derived from the same source dataset, and supervised adaptation to a low-resource Vietnamese target domain. We compare lightweight two-stage detectors based on Faster R-CNN with MobileNetV3-FPN against a compact YOLOv8s baseline, while also testing two small-object-oriented YOLO refinements as targeted diagnostic variants rather than as the primary claimed contribution. Across in-domain experiments, the compact YOLOv8s baseline delivers the strongest performance, achieving 84.38% AP50 on the curated benchmark, whereas performance drops to 81.16% AP50 under the broader protocol, indicating that benchmark breadth materially changes the apparent difficulty of the task and the relative strength of competing models. In the target-domain setting, source-initialized fine-tuning improves optimization behavior and can outperform target-only training in a representative single run, but repeated-seed evaluation does not confirm a stable held-out-test advantage under the same adaptation budget. These findings suggest that conclusions drawn from a single curated benchmark may overstate model robustness, and that for wood defect detection, protocol breadth and source-to-target shift should be treated as central evaluation factors rather than secondary experimental details.

Năm:

|

Chủ đề: Khoa học máy tính và thông tin

|

Nhà xuất bản: Computers, Materials & Continua

Dung Manh Nguyen
Ghép tế bào gốc tạo máu (HSCT) yêu cầu huy động đủ tế bào gốc từ những người hiến tặng khỏe mạnh. Tuy nhiên, một số người hiến tặng, được gọi là người huy động kém, không cung cấp đủ tế bào mặc dù đã được huy động, dẫn đến sự chậm trễ và kết quả bất lợi. Để giải quyết thách thức này, chúng tôi đề xuất một khung học máy có thể giải thích được, phân loại người hiến tặng thành người huy động kém và người huy động tốt bằng cách sử dụng các đặc điểm lâm sàng. Phương pháp này tích hợp Loại bỏ đặc điểm đệ quy và bộ phân loại XGBoost vào một quy trình nhẹ, phù hợp để triển khai trong các hệ thống hỗ trợ quyết định lâm sàng đa trung tâm, dựa trên mạng lưới. Mô hình được đề xuất đạt độ chính xác 96,1%, AUC 98,7% và độ thu hồi 98,1% đối với người huy động kém. Để tăng cường khả năng giải thích, chúng tôi sử dụng SHAP để định lượng đóng góp của các yếu tố lâm sàng chính như số lượng tiểu cầu, tuổi và MCV. Những giải thích này xác nhận các yếu tố dự báo đã được thiết lập đồng thời gợi ý những hiểu biết mang tính khám phá, hỗ trợ tiềm năng của Học máy (ML) có thể giải thích được để cải thiện việc sàng lọc người hiến tặng trong HSCT.

Năm:2026

|

Chủ đề: Trí tuệ nhân tạo

|

Nhà xuất bản:

Siripong Sangsarpan
Bài báo này xem xét thiết kế hệ thống điều khiển cho các hệ thống pha tối thiểu nhằm đảm bảo đầu ra bám sát tín hiệu đầu vào tham chiếu không tuần hoàn và các nhiễu tuần hoàn được giảm thiểu mà không cần điều khiển lặp lại. Trong các ứng dụng thực tế, hệ thống điều khiển thường phải giảm thiểu nhiễu tuần hoàn và làm cho đầu ra bám sát tín hiệu đầu vào tham chiếu không tuần hoàn. Để đáp ứng các yêu cầu này, điều khiển lặp lại đã được đề xuất. Điều khiển lặp lại có thể giảm thiểu nhiễu tuần hoàn. Tuy nhiên, điều khiển lặp lại thường dẫn đến các bộ điều khiển bậc cao. Để thiết kế một bộ điều khiển bậc thấp có khả năng giảm thiểu nhiễu tuần hoàn, hệ thống điều khiển phải được thiết kế mà không sử dụng điều khiển lặp lại. Trong bài báo này, hệ thống điều khiển sử dụng bộ quan sát nhiễu đa chu kỳ để giảm thiểu nhiễu tuần hoàn được đề xuất. Bộ quan sát nhiễu đa chu kỳ sử dụng bộ lọc bậc thấp và giảm thiểu nhiễu tuần hoàn bằng cách sử dụng chu kỳ của nhiễu. Vì bộ quan sát nhiễu đa chu kỳ sử dụng bộ lọc bậc thấp, nên việc thiết kế bộ điều khiển bậc thấp trở nên khả thi. Tuy nhiên, chưa có nghiên cứu nào về phương pháp thiết kế hệ thống điều khiển sử dụng bộ quan sát nhiễu đa chu kỳ. Để thiết kế bộ điều khiển bậc thấp nhằm giảm thiểu nhiễu định kỳ, hàm truyền từ nhiễu đến đầu ra phải có số cực hữu hạn. Điều kiện để hàm truyền từ nhiễu đến đầu ra có số cực hữu hạn được làm rõ. Ngoài ra, điều kiện ổn định nội tại của hệ thống điều khiển sử dụng bộ quan sát nhiễu đa chu kỳ làm cho số cực hữu hạn cũng được làm rõ. Dựa trên các điều kiện trên, một phương pháp thiết kế hệ thống điều khiển sử dụng bộ quan sát nhiễu đa chu kỳ cũng được đề xuất.

Năm:2026

|

Chủ đề: Khoa học kỹ thuật và công nghệ khác

|

Nhà xuất bản: International Journal of Innovative Computing, Information and Control

Hoàng Phi Dũng
Computer Networks and Online Social Networks have become fundamental infrastructures for global information dissemination, encompassing systems and platforms such as the Internet, Facebook, TikTok, and Twitter... Owing to their large scale and high connectivity, these networks provide favorable environments for the propagation of computer viruses and the diffusion of harmful information. One of the widely adopted approaches for reducing the extent of infection in a network is to remove selected edges and deactivate certain nodes. This leads to a fundamental problem in network analysis: identifying the most critical edges and the most influential nodes, either in the entire network or within a specific community from a set of seeds.

Năm:

|

Chủ đề: Trí tuệ nhân tạo

|

Nhà xuất bản:

Xueheng Niu
Với nhu cầu cải thiện khả năng lái xe tự động, chúng ta cần những mô hình có độ chính xác cao hơn trước đây. Các mô hình gần đây tập trung vào con người và phương tiện, nhưng trên đường cao tốc thì không có người. Do tốc độ cao, việc lái xe trên đường cao tốc nguy hiểm hơn so với lái xe trong thành phố, điều này khiến các mô hình không chỉ cần độ chính xác cao hơn mà còn cần tốc độ xử lý nhanh hơn. Để khắc phục vấn đề này, chúng tôi đề xuất một mô hình chỉ tập trung vào phương tiện cho tình huống đặc biệt này. Mô hình này dựa trên You Only Look Once v8 (YOLOv8), và bổ sung thêm Partial Convolution, Minimum Point Distance Intersection over Union (MPDIoU), Convolutional Block Attention Module. Trong bài báo này, chúng tôi trình bày lý thuyết về các module được sử dụng trong mô hình này và so sánh chúng với các module thường được sử dụng hiện nay. Sau đó, chúng tôi trình bày kiến ​​trúc mạng của mô hình này. Chúng tôi huấn luyện mô hình này chỉ trên một phần của KITTI Vision Benchmark Suite. Cuối cùng, chúng tôi so sánh hiệu năng của mô hình này với mô hình YOLOv8 gốc.

Năm:2025

|

Chủ đề: Kỹ thuật điện tử và viễn thông

|

Nhà xuất bản: ICIC Express Letters

Siripong Sangsarpan
Bài báo này nghiên cứu ứng dụng Học máy (ML) trong phát hiện gờ giảm tốc bằng cách sử dụng dữ liệu từ cảm biến điện thoại thông minh và Hệ thống chẩn đoán trên xe II (OBDII), tiêu chuẩn trên tất cả các mẫu xe. Nghiên cứu này khám phá sự tích hợp dữ liệu xe với dữ liệu cảm biến điện thoại thông minh để cung cấp giải pháp tiết kiệm chi phí nhằm nâng cao hiệu suất lái xe và an toàn. Chúng tôi đã triển khai bốn mô hình ML – Máy hỗ trợ vectơ (SVM), Thuật toán ngẫu nhiên (RF), Thuật toán tìm giá trị gần nhất (kNN) và Hồi quy logistic (LR) – để phân loại điều kiện đường. Dữ liệu được thu thập từ các xe được chọn và được xử lý thông qua lựa chọn đặc trưng và điều chỉnh siêu tham số để tối ưu hóa hiệu suất mô hình. Mô hình kNN đạt độ chính xác cao nhất là 95,45%, tiếp theo là SVM với 90,91%, Giá trị ngẫu nhiên RF với 85,82% và Hồi quy logistic với 65,91%. Kết quả nghiên cứu của chúng tôi chứng minh hiệu quả của việc sử dụng các kỹ thuật ML trên dữ liệu tích hợp từ điện thoại thông minh và OBD-II để phát hiện gờ giảm tốc. Nghiên cứu này đóng góp vào sự tiến bộ trong công nghệ ô tô, đặc biệt là trong việc phát triển các hệ thống tiết kiệm chi phí để giám sát điều kiện đường theo thời gian thực, cuối cùng là nâng cao an toàn đường bộ và hiệu quả lái xe.

Năm:2025

|

Chủ đề: Kỹ thuật điện tử và viễn thông

|

Nhà xuất bản: ICIC Express Letters

Shuyang Ning
Quy trình sản xuất bảng mạch in (PCB) ngày càng trở nên phức tạp, trong đó ngay cả những lỗi nhỏ cũng có thể làm giảm hiệu suất sản phẩm và tỷ lệ năng suất. Việc xác định chính xác các lỗi trên PCB là rất quan trọng nhưng vẫn còn nhiều thách thức. Các phương pháp phát hiện lỗi PCB truyền thống, chẳng hạn như kiểm tra bằng mắt thường và các công nghệ tự động, đều có những hạn chế. Mặc dù các lỗi có thể dễ dàng được xác định dựa trên tính đối xứng, nhưng khía cạnh vận hành lại khá khó khăn. Học sâu đã cho thấy tiềm năng trong việc phát hiện lỗi; tuy nhiên, các mô hình học sâu phát hiện lỗi PCB vẫn gặp phải các vấn đề như kích thước mô hình lớn, tốc độ phát hiện chậm và độ chính xác chưa tối ưu. Bài báo này sử dụng thuật toán YOLOv8 để phát hiện lỗi PCB. Chúng tôi cải tiến YOLOv8 gốc bằng cách nâng cấp bộ tối ưu hóa của nó lên RAdam. Kết quả thực nghiệm cho thấy so với mô hình YOLOv8 gốc, mô hình YOLOv8-RAdam được cải tiến đã đạt được sự cải thiện 11,97% và 6,35% về IoU và F-measure trong việc phát hiện lỗi PCB. Chiến lược được đề xuất giúp cải thiện hiệu quả độ chính xác của việc phát hiện lỗi PCB dựa trên học sâu.

Năm:2025

|

Chủ đề: Kỹ thuật điện tử và viễn thông

|

Nhà xuất bản: ICIC Express Letters

Lã Quang Hải
Training deep visual recognition networks is usually monitored using loss and accuracy. These measures show whether a model is improving, but they say little about how representations inside the network change during training. This paper proposes a dynamical systems framework for studying this internal evolution through layer activations. At each epoch, we compute three quantities from the activation trajectories. These form an effective integration measure based on detrended fluctuation analysis, a metastability measure based on the Kuramoto order parameter, and a composite stability index that combines the two. We apply the framework to nine architecture dataset configurations, including ResNet variants, DenseNet-121, MobileNetV2, VGG-16, and a pretrained Vision Transformer trained on CIFAR-10 and CIFAR-100. Under the present parameterisation, three retrospective patterns emerge. First, the integration measure separates CIFAR-10 from CIFAR-100 across the architectures studied and remains stable under broad hyperparameter variation. Second, the rolling volatility of the composite index often decreases before the accuracy curve plateaus, suggesting a candidate convergence signal that requires prospective validation. Third, the coupling between integration and metastability helps distinguish models that settle into richer representational regimes from those that remain more rigidly coupled. These observations motivate a retrospective four-state taxonomy of training regimes, namely Stable Convergent, Metastable High Integration, Partial Integration, and Rigidly Synchronised. The taxonomy is intended as an exploratory description of the configurations studied, rather than as a validated classifier. The results provide a foundation for future multi-seed, held-out, and prospective studies of dynamical diagnostics for deep visual model training.

Năm:2026

|

Chủ đề: Kỹ thuật thông tin

|

Nhà xuất bản: Discover Artificial Intelligence

Lê Minh Duy
Silicosis is a serious occupational lung disease caused by exposure to crystalline silica dust and remains difficult to detect early in at-risk worker populations. In this paper, we introduce the Silicosis Diagnosis Dataset (SDD), which comprises chest X-ray images and structured patient-profile information, including harmful habits and clinical symptoms. To exploit this multimodal dataset, we propose SiCLIP, a multimodal retrieval framework based on CLIP-ViT for silicosis screening and binary classification on SDD. SiCLIP learns a shared embedding space for chest X-ray images and patient profiles and performs retrieval-based aggregation for prediction. On the internally evaluated SDD benchmark, SiCLIP achieves higher accuracy and F1-score than several strong image-only deep learning baselines and the compared multimodal VLM baseline. In addition, SiCLIP provides case-based interpretability by grounding predictions in retrieved similar cases, complemented by supportive saliency visualizations. These results suggest that multimodal retrieval is a promising approach for silicosis screening support in occupationally exposed populations, while external validation remains necessary before broader clinical deployment.

Năm:2026

|

Chủ đề: Kỹ thuật thông tin

|

Nhà xuất bản: Artificial Intelligence in Medicine

Vũ Quang Vinh
Forest fires represent a significant environmental threat, primarily due to the substantial economic losses and human casualties they cause. Smoke serves as the most apparent early indicator of wildfires. However, detecting smoke effectively with computer vision is challenging, particularly when it is distant from the camera and only noticeable in a limited area. Overcoming this challenge with current methodologies often necessitates computationally intensive processing of higher resolution images or the installation of a higher density of cameras, both representing costly solutions. To address these limitations, we introduce a novel framework called Video-based Multiple Objects Kinetic Emission Detection (VMOKED). It is specifically designed to detect smoke emissions in forests accurately and scalably, even when operating under constrained computational budgets in centralized multi-stream processing environments. The VMOKED framework integrates three key components: (1) a real-time object detection model, (2) a compact Sky-Ground Segmentation (SGS) model utilizing a feature pyramid network architecture and MobileNetV3 backbone, and (3) a motion measurement module designed to leverage temporal information efficiently. Experimental results on our dataset demonstrate that the proposed VMOKED framework surpasses other methods in quantitative performance. Highlighting its efficiency, VMOKED requires only 64.89 Giga Floating-Point Operations Per Second (GFLOPs) and achieves a detection time of just 7.65 ms.

Năm:2026

|

Chủ đề: Kỹ thuật điện tử và viễn thông

|

Nhà xuất bản: Array

Phurinat Chaisarn
Plant stress monitoring in IoT systems is typically inferred from environmental variables, providing limited physiological insight. Although abscisic acid (ABA) is a reliable stress indicator, its measurement is destructive and unsuitable for continuous field use. This paper proposes a physiology-aware edge–cloud IoT framework for plant stress classification using non-invasive leaf electrical conductivity integrated with soil and environmental sensing. Leaf electrical conductivity acts as a proxy for stress-related changes in membrane integrity, ionic regulation, and stomatal behavior. A lightweight edge-deployed neural network enables real-time inference, while cloud services support data aggregation and model retraining. The system classifies water, heat, cold, light, and nutrient stress and delivers interpretable outputs via dashboards. Experimental results demonstrate accurate multi-class classification with latency suitable for real-time field deployment, highlighting the benefit of plant-derived physiological signals over environmental proxies.

Năm:

|

Chủ đề: Trí tuệ nhân tạo

|

Nhà xuất bản:

Hoàng Trọng Minh
In clustered wireless sensor networks (WSNs), reshaping the topology can redistribute cluster head load, but each such task consumes energy. This paper studies the refresh timing problem in static clustered WSNs, where the controller decides not only whether to rebuild the topology but also determines the time over which the selected topology remains active. The proposed method formulates topology maintenance as a semiMarkov adaptive holding-time control problem. At each control epoch, the controller selects a refresh indicator, a target cluster count, and a holding time. The topology builder uses explicit cluster head election, nearest head member association, and intra-cluster chain forwarding with one-hop cluster head transmission to the base station. Under nominal deployment, the proposed controller reaches a half-node death (HND) point of 1969.1 ±8.4 rounds with 0.104 J of control energy, while periodic refresh with T = 10 reaches 1819.7 ±32.6 rounds and consumes 1.133 J. Across seven tested deployment scenarios, the proposed method gives a higher HND point with lower control energy than the tested refresh-enabled baselines. Therefore, the method is positioned as a lifetime overhead control mechanism, favoring lower control energy and longer mid-life operation, whereas periodic refresh remains preferable when delivery performance is the primary objective

Năm:2026

|

Chủ đề: Kỹ thuật điện tử và viễn thông

|

Nhà xuất bản: Journal of Telecommunications and Information Technology

Xuan Nghia Pham
his paper investigates the performance of a full-duplex (FD) uncrewed aerial vehicle (UAV)-assisted energy-harvesting (EH) wireless network, in which a dedicated power beacon supplies radio-frequency energy to both an Internet-of-Things (IoT) sensor node and the UAV relay. A realistic system model is developed by accounting for residual self-interference (RSI), UAV mobility, and three-dimensional deployment. Based on this framework, exact closed-form formulas for the outage probability (OP) and energy efficiency (EE) are derived, enabling a comprehensive assessment of system reliability and energy utilization. The analytical results are validated through Monte-Carlo simulations, demonstrating excellent agreement with numerical results. The results reveal that the OP is highly sensitive to the power beacon transmit power, RSI level, and UAV altitude and horizontal position, where insufficient interference suppression and excessive UAV altitude significantly degrade link reliability. Moreover, the EE exhibits an optimal operating point with respect to the power beacon transmit power. Increasing the number of transmit antennas at the power beacon improves EE, while higher carrier frequencies lead to noticeable performance degradation. These findings provide useful design insights for the deployment and optimization of reliable and energy-efficient UAV-assisted EH networks.

Năm:2026

|

Chủ đề: Kỹ thuật điện tử và viễn thông

|

Nhà xuất bản: IEEE Access