Programlanabilir saqut derleyici projesi
Go to file
abdussamedulutas 817d36bc4a Postfix ve Prefix operatörleri binaryexpression ve unary için işlenebilir hale getirildi 2026-01-01 14:32:14 +03:00
.vscode vscode kod renklendirme geliştirildi 2025-12-28 15:43:08 +03:00
core Postfix ve Prefix operatörleri binaryexpression ve unary için işlenebilir hale getirildi 2026-01-01 14:32:14 +03:00
Parsing.cpp Pratt Parsing Algoritması eklendi 2025-12-28 21:58:15 +03:00
readme.md Readme 2025-12-23 15:08:07 +03:00
saqut Postfix ve Prefix operatörleri binaryexpression ve unary için işlenebilir hale getirildi 2026-01-01 14:32:14 +03:00
source.sqt Postfix ve Prefix operatörleri binaryexpression ve unary için işlenebilir hale getirildi 2026-01-01 14:32:14 +03:00

readme.md

Syntax

Syntax modunda 2 seçenek bulunmaktadır - JIR: Söz dizimi tamamen Java programlama diline uygun olarak parse edilmektedir. Compiling, transpiling desteklenir Interpreter desteklenmez - CIR: Söz dizimi tamamen C programlama diline uygun olarak parse edilir. Compiling ve Interpreter desteklenir. transpiling desteklenmez

Compiler short options

sqt kaynak kodunu çallıştırır
saqut file:sourcecode.sqt

sqt kaynak kodunu C koduna sonrada makine koduna derler. GCC gereklidir
saqut compile file:sourcecode.sqt output:program.exe

Derleyicinin olduğu gibi çalıştırılması interpreter moduna alır, konsola yazılan kodları alır çalıştırır outputu loglar
saqut 

Derleyici kodu alır ve IR üretir
saqut parse file:sourcecode.sqt output:program.ces

Derleyici IRyi alır ve çalıştırır. Burda kaynak kodu veya IR olup olmadığını otomatik anlar
saqut file:sourcecode.ces

Derleyici IRyi veya kaynak kodunu alır C diline çevirir
saqut transpile file:sourcecode.ces  output:program.c

Derleyici kaynak kodu ASTsini çıkarır ve kaydeder
saqut file:sourcecode.sqt ast:sourcecode.xml

Compiler Structure

1 Source Code

  • Yazılan kaynak kodun derleyiciye aktarılması
  • Derleyici için belirlenen seçenekler ile derleyici yapısının yeniden yapılandırılması
  • Derleyicinin outputlarının ayarlanması ve çıkışlarının aktarılması

2 Lexing

Kaynak kodun içindeki tüm harflerin gezilip tek parça büyük bir token listesinin oluşturulması

Bu işlemin sonucunda kaynak kodun içindeki tüm yapılar; semboller, sayılar, stringler ve operatörler olarak 4 kategoriye ayrılır

3 Tokenning

Tüm tokenler gezilerek bir Abstract Syntax Tree ağacı (AST) oluşturulur. Tek düze tokenler bu aşamada hiyerarşik olarak

File -> Class -> Methods -> Expressions / Statements -> Volumes -> Values

Şeklinde bir ağaç yapısına kavuşur. Böylece yazılan kaynak kodu anlaşılır ilk yapısına kavuşur

4 Parsing

Oluşturulan AST ağacı anlamlaştırılır ve zenginleştirilir. Tanımlanan değerler, fonksiyonlar, classler ve değişkenler belirlenir. Tip kontrolleri ve Syntax hataları burada keşfedilir. Ayrıca Ulaşılamayan kod alanları, sınıfların ulaşılamayan (private) accessorları kontrol edilir, tüm bir kod boyunca class, tipleme, değişken ve döngülerin kullanım adetleri analiz edilir. Sistem içinde kullanılan tüm yapılar için geniş kapsamlı bir Symbol tablosu oluşturulur

5 Optimizing

Zenginleştirilmiş AST üzerindeki analizler üzerinden bazı AST dalları silinir, değiştirilir veya yeni dallar eklenebilir

  • Constant Folding : 4 + 1 gibi sonucu belli olan ifadeler 5 olarak tutulur
  • Dead Code Elimination : returnden sonraki kod bloğunun silinmesi veya if(false) ve dengi statementlerin yapıdan kaldırılması
  • Matematiksel olarak değişmez kodların kaldırılması x * 1, x+0, x * 1 gibi valuelerin direkt x olarak değiştirilmesi
  • Hiç kullanılmayan değişkenlerin kaldırılması
  • Sabit (const) değerlerin döngülerin dışına çıkarılması veya programın globaline taşınması
  • Null Check Elimination : Daha önce nullcheck yapılmış bir değişkenin tekrar nullcheck yapılan kontrollerini devredışı bırakmak
  • Type Check Elimination : Daha önce typecheck yapılmış bir değişkenin tekrar typecheck yapılan kontrollerini devredışı bırakmak

6 Compiling

Oluşturulmuş tüm AST ağacını tamamen aynı işi yapan daha alt bir veri kümesine indirgeme işidir. Bellekteki AST yapısı ardışık komutlar dizisine çevrilir (Intermediate Representation) IR daha sonra tekrar okunup çalıştırılabilir.

Daha sonra IR ile kurulacak yapı ile bazen HeavyIR bazende LightIR üretilir. LightIR, en temiz ve hızlı ancak hiç bir ayrıntı içermeyen koddur. Kaynak kodun çalıştırılması için mükemmel veridir ancak debug verilerinden yoksundur HeavyIR, kaynak kodu verilerinin yanı sıra orjinal AST üzerinde tanımlanmış değişken isimleri ayrıntıları ve tiplemeleride içerir. LightIRye göre daha ayrıntılı ve büyüktür ancak debugging ve kaynak kodun parça parça okunduğu durumlar için (örneğin interpreter) kullanışlıdır

7 Interpreting

Derleyici HeavyIR üretir ve Symbol tablosunu silmez. Optimizasyonların çoğu kapatılır. Oluşturulmuş HeavyIR kodu çalıştırılır çalışma bittikten sonra stackframe kapatılmaz yeni girişler beklenir. Yeni kaynak kodu girişleri yapıldığında yine derlenir ve anında çalıştırılır. Yeni çalıştırılan kaynak kodu bir önceki stackframe içersinde symbol tablosu dikkate alınarak output üretir böylece önceki değerler halen kullanılabilir

or 7 Executing

Derleyici LightIR üretir IR oluşturulduktan sonra symbol tablosu silinir. Üretilen IR otomatize edilmiş bellekte yüksek performans ile çalıştırılır.

Derleyici o an ürettiği kaynak kodu anında çalıştırdığı (JIT) gibi Daha önce üretilmiş ve depolanmış IR kodunuda çalıştırabilir

or 7 Transpiling

Derleyici HeavyIR üretir ve Symbol tablosunu silmez. Derleyici IR üretmez bunun yerine AST Üzerinden yeni bir dile çevrilir. Duruma göre daha üst bir seviye dile dönüşüm yapıldığı gibi daha alt bir dile dönüşüm yapılabilir. IR üretilmez bunun yerine alınan kaynak kodu farklı bir kaynak koduna çevrilir

programmable compiler

Derleyici tek seferde kaynak kodu alıp okuyup çalıştırabilir veya derleyebilir. Ayrıca debug ortamlarında veya daha ayrıntılı projelerde derleme anına müdehale edilebilir

Stage Session

Derleyiciye verilen bazı parametreler ile Lexer ve Tokenizer anında bazı işlemlerin yapılması engellenebilir Örneğin accessorler kapatılabilir, hexedecimal sayılar kapatılabilir. Veya class olmadan globale yazılmış kodlar engellenebilir

AST Session

Derleyiciye verilen bazı parametreler ile class yapılarına müdehale edilebilir, tipleme sistemleri sabitlenebilir, tek bir metot içerisine yazılacak kod sınırlanabilir veya for içerisinde for döngüsü kısıtlanabilir. Yazılan kod için analizler sonucunda bazı bloklar görmezden gelinebilir veya manipüle edilebilir

Optimizing Session

Optimizasyon aşamaları parametreler ile tek tek açılabilir veya kapatılabilir

Output Session

Derleyici ürettiği veriyi erken bir aşamada dosyalayabilir ve loglayabilir. Derleyicinin oluşturduğui token, Pure AST, Optimized AST, LightIR veya HeavyIR ayrı ayrı kaydedilebilir

Compiling Session

AST ağacını IRye dönüştürürken neleri aktaracağı derleyici parametre şeklinde verilebilir. IR, yanlızca JIT ve Compiling modunda değiştirilebilir. Interpreter modunda değiştirilmesine izin verilmez IR olarak tipleme, sınıflar, değişken isimleri, tekrarlama kayıtları, işlemler ve statementlerin hangilerinin eklenebileceği değiştirilebilir